2026-04-22 01:18

做了十年设计，这次真觉得自己多余了

歸藏的AI工具箱©

本文来自微信公众号：歸藏的AI工具箱，作者：歸藏的 AI 工具箱，原文标题：《做了十年设计，这次真觉得自己多余了｜GPT-Image-2 上手实测》

前几天GPT-Image-2泄露了，试了一下发现非常厉害，但当时只要试一下就不给我生成了。

刚好今天终于发布了，发布以后我搞了不少的玩法。

它有一个非常牛逼的特点：不需要复杂提示词，随手几个字就能出非常好的效果。

互联网运营图片

我们在vibe coding或者日常在互联网的工作中，经常需要生成运营图片。

比如产品更新公告、活动公告等，以前可能需要写一长串复杂的提示词。

但现在你只需要告诉它"苹果风格"、"3D"、"简洁卡片化"这种你能想到的词就可以了。

比如下面两个案例：

苹果风格宣传图：

我跟它说需要一张"产品苹果风格的中文宣传图"，然后把介绍网页发给它。它生成的图片排版非常精美，而且文字完全没问题。

提示词：用gpt-image-2为这个产品生成生成苹果风格的中文卡片宣传图：https://github.com/op7418/CodePilot

OpenAI风格宣传图：

我让它基于OpenAI的风格生成宣传图，并给了它一个OpenAI的更新公告。结果生成的风格确实延续了OpenAI以往那种渐变配色、简洁的设计感。

提示词：根据这篇文章生成一个产品更新的介绍海报，风格需要符合OpenAI以往的设计风格，内容需要简洁，整体呈现苹果风、卡片化、高级感：

以前这种图至少得占设计师半天，现在从工作流里直接消失了。

知识类卡片

然后就是非常需要世界知识的"知识类卡片"，这部分它也做得非常好。

排版非常丰富、内容也多样，而且不需要多说任何提示词。

比如第一个案例，我只是让他用可爱的风格画一张大语言模型的训练过程介绍。

提示词：用可爱的风格画一张大语言模型的训练过程科普图

第二个案例是这种类似于杂志和科普的内容，你经常在公众号里看见这种图片排版。

这种复杂排版用来介绍一些知识和科普信息。

提示词：用高级杂志感风格画一张茶叶种类和制作过程的科普图。

然后我发现它也能生成超级长的长图。

比如说，这里让它生成北京秋季的游览攻略图片，它就给了一张很长的图片。

提示词：生成北京秋季的游览攻略图片

可以看到它把秋天的特色景点、行程，以及美食、交通出行指南和一些其他的提醒都画上了。

就是你能想到的、你想不到的都在上面，而且排版非常精细优美。

你不用告诉它该画什么，它知道一张科普图该有哪些内容。

游戏概念和UI设计

然后就想让他试一下游戏这种非常复杂的类型。

图片UI也有，可能还有CG角色以及一些小字。这种非常复杂的情况，测试结果非常好。

这里先是简单的测试。

让他（提示词）参考《无畏契约》（Valorant）的游戏风格，生成一个以三国为主题、神话风格的FPS游戏选人界面UI图片。

可以看到模仿得非常像，就是界面的布局和交互采用了《无畏契约》（Valorant）的选人方式，但是整个氛围、风格、背景以及角色都变成了三国的这种感觉。

然后我就在想，再简单的提示词它能不能get到。比如说，我直接跟它说

提示词：生成一个"黑神话武松"的游戏截图。

可以看到它真的能get到，包括UI设计、整个界面以及画面风格，都是《黑神话》的游戏风格。

在生成游戏界面之后，心动游戏的黄老板演示了一个非常好玩的东西。

他转发了我的推特，演示了生成的一个ARPG游戏截图：画面是3D的，但是带有对话的选择框UI。

这不就是直接能玩游戏的吗？我们这种ARPG游戏，不就是立绘加上选择吗？

你让他给你生成一个带立绘、带选择的界面，直接告诉他选哪个，他就能给你画出下一张图。这不就是在GPT里面玩游戏吗？太爽了，没想到真行，我试了一下。

之后还换了一些别的游戏类型。比如说，最近我在玩三消游戏。

所以就让它生成了一个古代探宝风格的三消游戏UI截图。

可以看到这个的文字渲染和UI细节就非常的精细和丰富，它甚至连消除以后的特效都给你做出来了。

整个项目不只是UI，连交互设计和整个界面该有哪些玩法都有了，非常完整。

说到交互，前几天非常火的一个测试MBTI以这种恶搞的方式火出圈了。

然后我就在想，咱们这个是不是能整点更高级的？

于是我就让它基于《战锤40K》的世界观为我生成了一套测试题。

然后在结束之后，基于我回答的答案给我生成一个我在《战锤40K》里的角色卡片和对应的性格分析。

结果他给的这个角色分析卡可太对味儿了！

基于我的回答，它给我分配的是一个审判官（异端审判官）。

而且还虚构了身份档案、人物特征、专长能力，甚至还有角色小传。

一张图加几句对话，其实就是一个可玩的游戏demo，游戏原型的门槛又塌了一层。

帮你解释和介绍论文

前面不是说它能生成长图吗？我就在想能不能让它解释论文。

我们AI圈经常就是看论文，于是就把最近的Seedance 2.0的模型卡片（System Card）论文发给了它，没想到真可以！

提示词：帮我用高级、有杂志感的排版风格，详细且图形化地介绍这篇论文的内容，生成一张长图图片来让我理解它。要求使用中文。

网页设计

这是个极端挑战：我直接从小红书随便找了一张汽车的图片。

提示词：为这个汽车生成符合其气质和风格的官网UI设计稿。

原图是一张小米SU7的图片，图上没有任何文字，只有一个侧面的汽车。

但是它居然脑补出了这是小米的车，虽然把它猜成了SU7（也很厉害了，因为它就后背那点不一样，而且配色都是一样的）。

它为这张图生成了一个汽车官网，你们看一下吧，我觉得这个质量太离谱了。

他不知道学了多少。这张关于这辆车的图片，所有的细节都是对的：

内饰、剖面图、轮毂、大灯、尾翼、甚至价格🤣。

然后我又试了一下其他类型的网页，比如说我们常见的那种B端官网。

我直接跟他说：为B端广告投放平台生成一个官网的UI设计稿。

只能说他这个知识和搜索能力是非常的厉害。

他甚至知道这类型的网站上应该有哪些卖点，以及UI上应该展示哪些信息。太会了，这玩意儿真是完美设计。

它不只是会画，它还知道这行里每个角色该说什么话。

商品宣传图

GPT-Image-2模型甚至能给你随手拍的任何商品生成非常高级的商品海报。

而且你不需要说更多的提示词和内容，你只需要说一句：

提示词：帮我为这个产品生成宣传图片，宣传图片要符合这个产品的气质和风格

这是我随手拍的我的键盘，光线非常差，键盘上也比较脏。

但是它把这些都处理好了，而且还加上了跟这个键盘真的相关的卖点，整个设计风格非常像那么回事。

然后我又拿来了一盒朋友送的蓝莓，还是用的上面那个提示词，一个字都没有变。

但是它这次生成的风格完全匹配了农产品这个路数。

商品一致性可以说是非常高了，连蓝莓的位置都是对的。

但是蓝莓变得更大更饱满了。我只能说GPT你还是太会了。

一张商品图该用什么风格、该放什么卖点，这种判断以前是设计师最值钱的部分。

UI和VI设计

然后是UI设计。既然它的网页设计那么厉害，其实UI设计也不会差。

我先是找了一张参考图。

提示词：基于参考图的风格，生成一个健康App的UI设计稿。

他的还原度非常高，而且参考图其实跟这个主题没啥关系，只有一两个组件。

然后我又给了他一张VI设计的参考图

又给了他我用vibe coding开发的开源软件CodePilot的GitHub页面。

让他基于这个图片的风格和特色，为我的项目设计一套VI。主要的项目信息在这里：

它在读取了我的项目信息以后，没有简单地照抄参考图，而是把这些元素都提取出来，跟我本身的产品能力进行了扩展。

可以看到这套VI非常全面，该有的都有了：

色彩与字体、UI图与简单的介绍、图标贴纸与Logo变体、品牌主张与能力映射、宣传海报与官网示例。

比参考图原来的内容详细多了。

原本参考图里的那些设计元素也都被保留了下来。

给它一个参考，它能在这个参考上再往前走一大截。

我做了十年设计，说两句心里话

玩到这里，我越来越觉得这代模型真正变强的地方，是它"知道该画什么"。

以前设计师值钱的地方有两层：能画出来、知道该画成什么样。

第一层这两年早塌了，这次连第二层也开始松动。

你随手说一句"苹果风的宣传图"、"B端广告平台的官网"、"黑神话风的游戏截图"，它就懂你在说什么。

因为这个行业这些年所有的视觉语言、排版规律、品牌调性，它都吃下去了。

对大部分非设计岗的人来说，这是好消息。

以前卡在"先得找个设计师"那一步的事，现在自己就能往下走。

对我们这行来说，日常那些重复性的商业设计会被收走，剩下还值钱的是原创审美和品牌高度——本来那也只是金字塔尖那一小撮人的事。

再想远一点，Image V2出设计稿，GPT-5.5 Pro还原成代码，CodeX串成工作流。

从想法到可交付的东西，OpenAI在把这条生产线直接打包。

本内容由作者授权发布，观点仅代表作者本人，不代表虎嗅立场。
如对本稿件有异议或投诉，请联系 tougao@huxiu.com。

AI创投日报

频道：前沿科技