扫码打开虎嗅APP
本文来自微信公众号:APPSO (ID:appsolution),作者:张成晨,题图来自:视觉中国
说到线上发布会,你的脑海可能浮现这样的场景:一块大屏幕,一个主舞台,穿着正式的高管们双手置于胸前,将产品卖点娓娓道来。不出错,也不出彩。
上周的OpenAI和Google发布会,有些不一样。
OpenAI的现场布置得很有生活气息,主打北欧风的松弛感,CTO和员工们围坐在木桌前实时演示,拉近和观众的心理距离。
Google则用上了标志性的四色装饰舞台,还邀请了穿彩色长袍的DJ开场表演,演示AI音乐工具MusicFX,但DJ几近癫狂的精神状态,反而让台下昏昏欲睡。
我尽量不过多地考虑竞争对手,但我无法停止思考OpenAI和Google之间的审美差异。
Sam Altman看准时机,讽刺了Google一句,有些像当年乔布斯评价竞争对手:微软唯一的问题是他们没有品味。
说他茶味也好,戏多也罢,回顾OpenAI发布产品的过程,我们可以发现,这确实是一家擅长向大众塑造形象的科技公司。
如同魔法的产品,清奇的打广告方式
上周的发布会召开前,OpenAI究竟会发布什么,众说纷纭。Sam Altman回应的同时,不忘卖了个关子:
不是GPT-5,不是搜索引擎,而是一些人们可能会喜欢的新东西!对我来说感觉就像魔法一样。
字里行间,似乎呼应了科幻作家克拉克的名言:任何足够先进的技术,都与魔法无异。
最终,我们都知道了,发布的产品是GPT-4o,一个实时对音频、视觉和文本进行推理的端到端模型。
短短的26分钟里,OpenAI紧锣密鼓,演示了最重磅和直观的语音和视频交互功能,现场回应网友的问题。
听到酷似寡姐斯嘉丽·约翰逊音色的AI和人谈笑风生,低延迟,随时可以被打断,用各种语气讲睡前故事,解答纸上的数学题,为不同语言交替传译,甚至会因为赞美而害羞,熬夜的人们瞌睡都醒了大半。
语音和视频功能还用不上,但OpenAI用几分钟塑造了一个AI助手的雏形。
当天,Sam Altman还在X发了条动态,只有一个词:Her。
人红,同时也爱蹭。电影《她》(Her)里的虚拟助手萨曼莎,由寡姐配音。她迷人而性感的声音,几乎是整部电影最吸引人的地方,后来也成为了情感类语音助手的代名词。
不难理解,OpenAI为什么要抱住《她》这棵大树,因为不需要再讲一遍故事,人们自觉地想起这个故事,然后把它和GPT-4o相关联。
发布会利索地开完,OpenAI选择把更多的细节和演示例子留到博客里,让我们自己去翻。
博客一边延续发布会的套路,让演示落地到生活的具体需求,社交局三缺一没事,不懂面试技巧没事,熊孩子教不会也没事......
一边介绍发布会没有重点提及的功能,告诉你GPT-4o的图片识别功能挺准确,3D渲染也很逼真。
即刻上甚至有用户试着让GPT-4o挑西瓜和读X光片。无需刻意引导,如果用户对你的产品感兴趣,就会发掘出最有趣的用途。
其实OpenAI的思路很明确,发布会是面向大众开的,同时他们也知道,大众的痛点和对AI的好奇心在哪里。
回到克拉克的那句名言,什么是魔法?
对于大众来说,让科幻电影的功能落地为现实,提供更多AI的使用场景,通过免费等方式降低AI的使用门槛,融入更多具象的生活细节,其实就是魔法。
高端的商战,往往采取最朴素的手段
领先的技术和好用的产品是挺直腰杆的底气,但保持高调和抢热搜也是重要的。
作为反面例子的Google,已经被OpenAI“暗算”过很多次了。
上周,OpenAI比Google的发布会就早一天。今年2月,Gemini 1.5官宣几个小时后,被文生视频的Sora抢去风头。
Google当时败在,OpenAI很擅长吸睛和定义产品。GPT-4o和电影《她》深度捆绑,Sora则打出了“世界模拟器”的概念。
我们还用不上没关系,OpenAI选择和艺术家们合作,3月发布的第一批专业级作品惊艳众人。
过了一个月,和OpenAI合作的加拿大制作公司Shy Kids接受专访时,才更加客观地说明了Sora的优缺点,以及他们动用了大量人类后期。Sora生成的素材和可用的素材比例,大概为300:1。
OpenAI涉嫌虚假宣传了吗?也没有,一边适时地推CTO和团队出来接受采访,说Sora还不是一个产品,预计年内发布,一边在官方YouTube发布由Sora精心打造的MV。
偶尔,OpenAI的营销确实有些过于鸡贼,尤其擅长基于信息差的悬念营造,但也是因为这样,它从来不会淡出媒体和公众的视野。
前段时间,一个测评网站突然冒出一个神秘模型gpt2-chatbot,大家都在猜测,这是不是GPT-4.5,Sam Altman神神叨叨地回应“我对gpt2情有独钟”。
上周的发布会之后,OpenAI才摊牌,原来GPT-4o就是gpt2-chatbot。
这是Sam Altman擅长的造势套路,他还曾在专访中直言,说GPT-4“有些糟糕”,既让靠AI干活的打工人无言以对,又提高了外界对今夏发布的GPT-5的期待值。
Google在技术上并不慌,但不知怎么,营销总是差了些味道,没有OpenAI的存在感强烈,还会犯些破坏形象的错误。
去年12月发布的Gemini演示视频,让全世界兴奋了一下,很快被曝光有剪辑痕迹,实际体验并没有那么丝滑,演示者是基于静态图像帧和文本提示词与AI交互,而不是视频和语音,响应速度也被加快了。
今年Google I/O开了2个小时,发布了不少产品,并非滥竽充数以数量弥补质量,但最终让人记住的,主要是那个和GPT-4o差不多的AI助手Project Astra。
反过来想,面对Google这座巨轮,OpenAI或许也很紧张,所以屡屡剑走偏锋。
Google的人才、算力、旗下产品多年积累的庞大数据库,都具有显而易见的固有优势,Google I/O也在往AI全家桶的方向发展,深度地将AI整合到搜索框中。
正如英伟达高级科学家Jim Fan说的,Gemini不必是最好的那一个,但却可以成为最广泛使用的一个。
可能也因为如此,面对硬实力的Google,OpenAI希望把握自己的先发优势,一边坚持力大砖飞的模型,一边尝试更接地气的产品和功能探索,洞察痛点,维持潮酷前卫的形象。
面向大众的商业公司,让技术人性化的悖论
如果用颜色形容,AI应该是个“冷色调”的技术领域,不管是算法、大模型还是机器人,都给人敬而远之的感觉。
Google的代表色是蓝色、红色、黄色和绿色,但你对OpenAI的印象,可能是那些出镜员工穿着的公司logo灰色卫衣、用着的公司logo黑色杯子。
其实,除了保留技术的潮感,OpenAI也希望他们的形象是平易近人的。
网站是OpenAI的产品之一,承载着对外宣传的期望,在我们不会特别留意的地方,OpenAI同样也下了功夫。
OpenAI成立于2015年,起初是非营利组织,以最有可能造福全人类的方式,开发通用人工智能(AGI)。2019年,OpenAI转变为有限利润公司,成立了产品部门。
但可能很少有人知道,从2021年12月开始,OpenAI与创意机构Area17合作,升级自己的logo、品牌和网站。
彼时,他们已经决定在2022年发布ChatGPT。Area17的任务是,让OpenAI准备好,成为一家“更加面向公众”的公司。
Area17的设计思路是“让技术人性化”:从人的角度看待AI,反映AI如何影响人的生活。
体现在网站上,运用了强烈的色彩、抽象的形状,既保留了科技感,又注入了人文色彩,配图主要是两种主要类型:抽象的AI生成图片,浅景深的暖色调人像摄影。
最初的排版甚至有些怀旧的报刊杂志风,因为未知容易让人恐惧,设计团队想带给用户舒适和安全的感觉。
设计是传达理念的媒介,无形地影响和塑造用户对产品的观念。
OpenAI为ChatGPT设计的对话界面,思路也是类似的,简单性高于一切,每个交互都不言自明,无需说明书。
同样是语音助手,GPT-4o和Project Astra的侧重方向是不同的,前者突出“情感”,懂幽默,会害羞。后者突出“助理”,更加谨慎。
然而,就像《她》的BE结尾,OpenAI越宣传自己产品的人性化,越让人怀疑背后的危险。从所作所为来看,OpenAI似乎也正在背离自己的初衷。
自从董事会的宫斗事件以来,首席执行官Sam Altman个人的行事作风就陷入了争议。
上周,OpenAI首席科学家Ilya Sutskever官宣离职,维护AI安全的超级对齐团队负责人之一Jan Leike出走,外媒Vox还曝光了OpenAI严苛的离职协议。
GPT-4o有与寡姐相似的音色,OpenAI解释是找了另外的配音演员。今天寡姐声明,OpenAI找过自己,但她拒绝了,并没有授权自己的声音给OpenAI,已经发律师函让OpenAI下架和她相似的音色。
巧言令色,鲜矣仁。
越向成熟的商业公司发展,OpenAI越无法回应“创建造福全人类的安全通用人工智能”,这个写在他们最初使命里的问题。
正如压碎创意工具的苹果iPad广告《Crush》引起的争议,迎接技术的变革和恐惧技术的威胁,两种情绪交织并行,已经是时代的旋律。OpenAI或许让我们更多地看到前者,但无法控制我们怀疑后者。
本文来自微信公众号:APPSO (ID:appsolution),作者:张成晨