扫码打开虎嗅APP

搜索历史
删除
完成
全部删除
热搜词
GPT-Image-2通过简化提示词需求、理解行业设计语言,彻底颠覆了传统设计流程,使非专业用户也能快速生成高质量视觉内容,同时冲击了设计师的常规工作价值。 ## 1. 运营图片设计的革命性简化 - 仅需"苹果风格"、"3D"等简单词汇即可生成专业级宣传图,如OpenAI风格海报和苹果风产品卡片,传统需半天的设计流程被压缩至秒级 - 模型自动处理复杂排版和文字适配,如中文宣传图的文字渲染精准度媲美人工设计 ## 2. 知识类卡片的智能生成 - 无需详细提示即可创建复杂排版内容,如大语言模型训练科普图自动包含完整知识框架 - 长图生成能力突出,北京秋游攻略整合景点/美食/交通等多元信息,排版精细度超越人工预期 ## 3. 游戏UI与概念设计的突破 - 精准复刻游戏风格,《无畏契约》UI转三国主题或《黑神话》风格截图均保持原版交互逻辑 - 黄老板演示的ARPG对话界面证明可生成可玩原型,三消游戏UI连消除特效都完整呈现 ## 4. 论文解释与网页设计的惊人表现 - 将Seedance 2.0论文转化为杂志级长图解读,实现学术内容可视化 - 仅凭汽车侧视图即生成完整官网设计,包括正确推测小米SU7车型及虚构价格参数 ## 5. 商品与品牌设计的专业替代 - 脏键盘照片自动优化为专业宣传图,蓝莓包装保持农产品调性且修正果实形态 - VI设计能基于GitHub页面扩展全套品牌系统,包含色彩/图标/海报等12类物料
2026-04-22 01:18

做了十年设计,这次真觉得自己多余了

本文来自微信公众号: 歸藏的AI工具箱 ,作者:歸藏的 AI 工具箱,原文标题:《做了十年设计,这次真觉得自己多余了|GPT-Image-2 上手实测》


前几天GPT-Image-2泄露了,试了一下发现非常厉害,但当时只要试一下就不给我生成了。


刚好今天终于发布了,发布以后我搞了不少的玩法。


它有一个非常牛逼的特点:不需要复杂提示词,随手几个字就能出非常好的效果。


互联网运营图片


我们在vibe coding或者日常在互联网的工作中,经常需要生成运营图片。


比如产品更新公告、活动公告等,以前可能需要写一长串复杂的提示词。


但现在你只需要告诉它"苹果风格"、"3D"、"简洁卡片化"这种你能想到的词就可以了。


比如下面两个案例:


苹果风格宣传图:


我跟它说需要一张"产品苹果风格的中文宣传图",然后把介绍网页发给它。它生成的图片排版非常精美,而且文字完全没问题。


提示词:用gpt-image-2为这个产品生成生成苹果风格的中文卡片宣传图:https://github.com/op7418/CodePilot


OpenAI风格宣传图:


我让它基于OpenAI的风格生成宣传图,并给了它一个OpenAI的更新公告。结果生成的风格确实延续了OpenAI以往那种渐变配色、简洁的设计感。


提示词:根据这篇文章生成一个产品更新的介绍海报,风格需要符合OpenAI以往的设计风格,内容需要简洁,整体呈现苹果风、卡片化、高级感:


以前这种图至少得占设计师半天,现在从工作流里直接消失了。


知识类卡片


然后就是非常需要世界知识的"知识类卡片",这部分它也做得非常好。


排版非常丰富、内容也多样,而且不需要多说任何提示词。


比如第一个案例,我只是让他用可爱的风格画一张大语言模型的训练过程介绍。

提示词:用可爱的风格画一张大语言模型的训练过程科普图



第二个案例是这种类似于杂志和科普的内容,你经常在公众号里看见这种图片排版。


这种复杂排版用来介绍一些知识和科普信息。


提示词:用高级杂志感风格画一张茶叶种类和制作过程的科普图。



然后我发现它也能生成超级长的长图。


比如说,这里让它生成北京秋季的游览攻略图片,它就给了一张很长的图片。


提示词:生成北京秋季的游览攻略图片


可以看到它把秋天的特色景点、行程,以及美食、交通出行指南和一些其他的提醒都画上了。


就是你能想到的、你想不到的都在上面,而且排版非常精细优美。



你不用告诉它该画什么,它知道一张科普图该有哪些内容。


游戏概念和UI设计


然后就想让他试一下游戏这种非常复杂的类型。


图片UI也有,可能还有CG角色以及一些小字。这种非常复杂的情况,测试结果非常好。


这里先是简单的测试。


让他(提示词)参考《无畏契约》(Valorant)的游戏风格,生成一个以三国为主题、神话风格的FPS游戏选人界面UI图片。


可以看到模仿得非常像,就是界面的布局和交互采用了《无畏契约》(Valorant)的选人方式,但是整个氛围、风格、背景以及角色都变成了三国的这种感觉。



然后我就在想,再简单的提示词它能不能get到。比如说,我直接跟它说


提示词:生成一个"黑神话武松"的游戏截图。


可以看到它真的能get到,包括UI设计、整个界面以及画面风格,都是《黑神话》的游戏风格。


在生成游戏界面之后,心动游戏的黄老板演示了一个非常好玩的东西。


他转发了我的推特,演示了生成的一个ARPG游戏截图:画面是3D的,但是带有对话的选择框UI。


这不就是直接能玩游戏的吗?我们这种ARPG游戏,不就是立绘加上选择吗?


你让他给你生成一个带立绘、带选择的界面,直接告诉他选哪个,他就能给你画出下一张图。这不就是在GPT里面玩游戏吗?太爽了,没想到真行,我试了一下。


之后还换了一些别的游戏类型。比如说,最近我在玩三消游戏。


所以就让它生成了一个古代探宝风格的三消游戏UI截图。


可以看到这个的文字渲染和UI细节就非常的精细和丰富,它甚至连消除以后的特效都给你做出来了。


整个项目不只是UI,连交互设计和整个界面该有哪些玩法都有了,非常完整。


说到交互,前几天非常火的一个测试MBTI以这种恶搞的方式火出圈了。


然后我就在想,咱们这个是不是能整点更高级的?


于是我就让它基于《战锤40K》的世界观为我生成了一套测试题。


然后在结束之后,基于我回答的答案给我生成一个我在《战锤40K》里的角色卡片和对应的性格分析。



结果他给的这个角色分析卡可太对味儿了!


基于我的回答,它给我分配的是一个审判官(异端审判官)。


而且还虚构了身份档案、人物特征、专长能力,甚至还有角色小传。


一张图加几句对话,其实就是一个可玩的游戏demo,游戏原型的门槛又塌了一层。


帮你解释和介绍论文


前面不是说它能生成长图吗?我就在想能不能让它解释论文。


我们AI圈经常就是看论文,于是就把最近的Seedance 2.0的模型卡片(System Card)论文发给了它,没想到真可以!


提示词:帮我用高级、有杂志感的排版风格,详细且图形化地介绍这篇论文的内容,生成一张长图图片来让我理解它。要求使用中文。


网页设计


这是个极端挑战:我直接从小红书随便找了一张汽车的图片。


提示词:为这个汽车生成符合其气质和风格的官网UI设计稿。


原图是一张小米SU7的图片,图上没有任何文字,只有一个侧面的汽车。


但是它居然脑补出了这是小米的车,虽然把它猜成了SU7(也很厉害了,因为它就后背那点不一样,而且配色都是一样的)。


它为这张图生成了一个汽车官网,你们看一下吧,我觉得这个质量太离谱了。


他不知道学了多少。这张关于这辆车的图片,所有的细节都是对的:


内饰、剖面图、轮毂、大灯、尾翼、甚至价格🤣。


然后我又试了一下其他类型的网页,比如说我们常见的那种B端官网。


我直接跟他说:为B端广告投放平台生成一个官网的UI设计稿。


只能说他这个知识和搜索能力是非常的厉害。


他甚至知道这类型的网站上应该有哪些卖点,以及UI上应该展示哪些信息。太会了,这玩意儿真是完美设计。



它不只是会画,它还知道这行里每个角色该说什么话。


商品宣传图


GPT-Image-2模型甚至能给你随手拍的任何商品生成非常高级的商品海报。


而且你不需要说更多的提示词和内容,你只需要说一句:


提示词:帮我为这个产品生成宣传图片,宣传图片要符合这个产品的气质和风格


这是我随手拍的我的键盘,光线非常差,键盘上也比较脏。


但是它把这些都处理好了,而且还加上了跟这个键盘真的相关的卖点,整个设计风格非常像那么回事。


然后我又拿来了一盒朋友送的蓝莓,还是用的上面那个提示词,一个字都没有变。


但是它这次生成的风格完全匹配了农产品这个路数。


商品一致性可以说是非常高了,连蓝莓的位置都是对的。


但是蓝莓变得更大更饱满了。我只能说GPT你还是太会了。


一张商品图该用什么风格、该放什么卖点,这种判断以前是设计师最值钱的部分。


UI和VI设计


然后是UI设计。既然它的网页设计那么厉害,其实UI设计也不会差。


我先是找了一张参考图。


提示词:基于参考图的风格,生成一个健康App的UI设计稿。


他的还原度非常高,而且参考图其实跟这个主题没啥关系,只有一两个组件。



然后我又给了他一张VI设计的参考图


又给了他我用vibe coding开发的开源软件CodePilot的GitHub页面。


让他基于这个图片的风格和特色,为我的项目设计一套VI。主要的项目信息在这里:


它在读取了我的项目信息以后,没有简单地照抄参考图,而是把这些元素都提取出来,跟我本身的产品能力进行了扩展。


可以看到这套VI非常全面,该有的都有了:


色彩与字体、UI图与简单的介绍、图标贴纸与Logo变体、品牌主张与能力映射、宣传海报与官网示例。


比参考图原来的内容详细多了。


原本参考图里的那些设计元素也都被保留了下来。



给它一个参考,它能在这个参考上再往前走一大截。


我做了十年设计,说两句心里话


玩到这里,我越来越觉得这代模型真正变强的地方,是它"知道该画什么"。


以前设计师值钱的地方有两层:能画出来、知道该画成什么样。


第一层这两年早塌了,这次连第二层也开始松动。


你随手说一句"苹果风的宣传图"、"B端广告平台的官网"、"黑神话风的游戏截图",它就懂你在说什么。


因为这个行业这些年所有的视觉语言、排版规律、品牌调性,它都吃下去了。


对大部分非设计岗的人来说,这是好消息。


以前卡在"先得找个设计师"那一步的事,现在自己就能往下走。


对我们这行来说,日常那些重复性的商业设计会被收走,剩下还值钱的是原创审美和品牌高度——本来那也只是金字塔尖那一小撮人的事。


再想远一点,Image V2出设计稿,GPT-5.5 Pro还原成代码,CodeX串成工作流。


从想法到可交付的东西,OpenAI在把这条生产线直接打包。

本内容由作者授权发布,观点仅代表作者本人,不代表虎嗅立场。
如对本稿件有异议或投诉,请联系 tougao@huxiu.com。

大 家 都 在 搜