正确的提示信息

扫码打开虎嗅APP

从思考到创造
打开APP
搜索历史
删除
完成
全部删除
热搜词
2024-08-23 19:29

魔改“黑神话悟空”,打败Midjourney,这个AI生图神器让人上头

本文来自微信公众号:APPSO (ID:appsolution),作者:张成晨,题图来自:AI生成

文章摘要
Ideogram 2.0文生图AI,文字生成强大,新手友好,适合多领域应用。

• 🎨 精准生成文字,设计感强,适合广告、海报等

• 🌍 国际化支持中文提示,翻译优化友好

• 📱 新推出iOS应用,随时随地生成图片

当AI文生图比拼真实度、艺术感,Ideogram开辟了一个刁钻的赛道:在图片上精准生成文字,并且字体和排版都好看。


这个需求并不小众,一键生成海报、插画,还不用P图,能够省不少事,很适合对设计一窍不通的普通人。


我们之前写过Ideogram的1.0版本。8月21日,2.0版本来了,真实感更好了,海报更有设计感了,文字这个看家本领也更强了。



你或许从来没有听说过它,这是一款前Google员工开发的AI产品,缺点不少,但长板能“弯道超车”Midjourney。


AI想知道,你说的悟空,是哪个悟空


Ideogram有个特别新手友好的功能:“魔法提示”。


你直接输入中文提示词,它会帮你翻译成英文,同时帮你优化。作为一款海外产品,这样的操作很能收买人心。


同时,Ideogram主打五种风格:普通、写实、设计、3D、动漫,都很好理解,所以选择起来也不会让人纠结。



先来个简单的中文提示词,“拿着金箍棒的孙悟空”,动漫风格,让AI帮我翻译和优化,看看它能自由发挥成什么模样。


当水灵灵的《七龙珠》版悟空出来的时候,我惊了一下,一看提示词,AI把孙悟空翻译成了“Son Goku”,那就不奇怪了。



而且,也很想问问Ideogram,是不是太明目张胆,给版权费了么。


为了避免AI再误解,再输入提示词的时候,我不偷懒了,强调“孙悟空”是“Sun Wukong”,不是“Son Goku”。


这次走写实风格,并且规定了比较详细的场景,大圣身穿铠甲,手拿金箍棒,神情肃穆,威风凛凛,站在佛窟前,温暖的橙色调,图片底部写着“Black Myth:Wukong”(黑神话:悟空)。



文字没有错误,大写字母冲击感强,佛窟的氛围也营造了三分,但“大圣”的气质差了点、形象返祖了点,眼神里也没有光。


用相同的提示词让Midjourney生成一次,文字既有错误又没设计感,但稍帅一筹的“大圣”和页游的画风弥补了这一点。


Midjourney生成


不甘心的我又试了3D风格,提示词基本保持不变,只是把底部的文字改成了“8月20日游戏上线”。


结果,Ideogram生成的结果很像某个国风Q版盲盒系列的宣传图,画面处理得很干净,但完全不是我脑海里的3D游戏风格,还把美猴王画出了二郎神的模样。


并且AI也从中暴露了自己,虽然它对英文的文字渲染得心应手,却对中文一窍不通,这个缺陷从1.0延续到了2.0。



看来海外产品不够理解国内的传统文化,Ideogram第一回合的表现有些令人失望,却也不失趣味。


Ideogram团队说过,2.0版本不输Flux和DallE。最近,Flux真实版LoRA生成的TED演讲照片因为真假难辨,骗过了不少网友的眼睛。那么就来测测,Ideogram生成的结果能多像照片。


Flux生成


选择写实风格后,我输入了中文提示词,TED演讲照片,幻灯片标题为“Ideogram 2.0发布”,上面有三个要点:“文字准确”“擅长设计”和“更真实”,女性演讲者站在白板前,背景中有几个人。



可以看出,Ideogram的语义理解是不错的,该有的元素都有,TED的标志几乎以假乱真,演讲者和观众的表情都很生动,头发和皮肤比较自然。


不过,细节处理得还不够好,虽然要求生成的文字没有问题,随机出现的一些小字坏了一锅粥,人物的手指和身体也不太对劲,但已经比之前的1.0版本强太多了。


至于海报设计,可以说是Ideogram吊打其他文生图AI的“舒适区”了。


如果以票房异常火爆的《异形:夺命舰》为考题,AI能设计出那种不可名状的恐怖感觉吗?


我选择了设计风格,用提示词描述了一下画面的要素,并特别提及,海报底部写上一句:“未成年观众谨慎观看。”



总体的效果让人眼前一亮,长串的文字也成功生成了,只有一处小错误,但特别不写实,更像美漫的画风,和真人电影不太相配。


我再以暑期档烂片《红楼梦之金玉良缘》为灵感,让Ideogram生成海报,提示词写到的背景、装饰物乃至人物都在其中了,再次感叹提示词的跟随性真的不错。


片名当然也写对了,但字体像借鉴了指环王,有些出戏,整体风格更像花木兰动画电影。



Ideogram的“设计风格”偏向二次元,比较独特,但反过来想,这也局限了海报的使用场景。


小结一下,Ideogram是一款很有自己特色的AI文生图产品,写实的水平和Flux相近,艺术感和Midjourney各有千秋。


“rainy summer”图案


但文字生成水平独一档,比较适合用来生成海报、插画、广告、表情包、T恤印花等。


人类评估的结果显示,Ideogram 2.0在提示词对齐、整体表现和文本渲染质量方面,都比Flux Pro和DALL·E 3更好。


但这是Ideogram自己的说法


可玩性高又接地气,这样的AI“甜品”不妨多来一些


去年8月22日,Ideogram宣布成立,与2.0发布正好相隔一年。


创始团队共7人,来自Google Brain、加州大学伯克利分校、卡内基梅隆大学和多伦多大学,其中4位是Google文生图扩散模型Imagen研究论文的作者。


这次除了发布2.0,Ideogram还推出了iOS app,国内可以直接下载,Android版计划稍晚发布,从网页到移动端,我们可以随时随地生成图片了。


手机端界面


Ideogram目前向所有用户免费开放,不过,额度非常有限,生成5次共20张照片后,Ideogram就提醒我,10个积分用完了,请明天再来。(当然,隔壁的Midjourney免费生成25张也没有显得多大气。)


如果很少接触文生图,想要一款文生图AI用来入门的,Ideogram是个不错的选择。


输入中文提示词、用“魔法提示”翻译和优化是一方面,另外,Ideogram还有很多选项帮你生成更接近脑海所想的画面。


提供范围有限的选项让用户“点击”,相比在空白的输入框完成“输入”,交互起来更简单。想要什么图片比例、什么风格、什么色调,Ideogram都可以让你挑选。


不同色调的“戴珍珠耳环的少女吃麦当劳”


不会写提示词,那也可以画出来,让Ideogram帮我们化腐朽为神奇。


我为我的糟糕画工感到抱歉,但AI能够领会意思,优化了线条和上色,还加了个背景,格调一下子上去了。有了AI,谁不是神笔马良。



另外,网页版的输入框下面,都是他人生成的作品,遇到喜欢的,我们可以查看和参考提示词。Ideogram表示,他们的用户在过去一年生成了超过10亿张公开可见的图片。


如果想要生成一个特定的对象,但又不知道怎么写提示词,Ideogram这次还推出了用文本搜索公共创作库的功能,但这个功能目前需要会员。


搜索“cat”的结果


总而言之,Ideogram是一款可玩性较强的文生图产品。


它可以比较精准地生成用户所需的文字内容,并适配各种风格的图片,就业领域很广。



图源:Ideogram博客


偶尔还能带来情绪价值,以图言志,虽然做的表情包太偏欧美互联网的审美了。


“我想玩《黑神话:悟空》”表情包


Ideogram的整体质量不差,文本功能强大,对新手友好,使用方便,交互也让人愉悦。当AI工具兼具了创意、便利和分享价值,就很容易让人上头。


一个照着模子刻出来的世界太无聊了,洞察到很小的需求,然后将解决办法做到行业第一,那也很有意思。


世界上有很多的产品,同时有更多的受众,我们可以期待更多这样的AI“甜品”。

本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系 hezuo@huxiu.com
如对本稿件有异议或投诉,请联系tougao@huxiu.com
打开虎嗅APP,查看全文
频道:

支持一下

赞赏

0人已赞赏

大 家 都 在 看

大 家 都 在 搜

好的内容,值得赞赏

您的赞赏金额会直接进入作者的虎嗅账号

    自定义
    支付: