扫码打开虎嗅APP
出品|虎嗅科技组
作者|余杨
编辑|苗正卿
头图|视觉中国
有没有发现,降温后,下班回到楼道,家家户户的外卖似乎都香了很多。
这不是错觉,更不是变馋了。
科学研究表明,一方面,寒冷天气中,人体需要更多的能量来保持体温,高热量食物可以提供这些所需的能量。另一方面,在进化过程中,人类为了在食物稀缺的季节生存,会自然地增加脂肪储备以备不时之需。虽说现在有暖气,没有天寒地冻的威胁,但深藏在基因里的本能,还是会驱使人们寻求高热量食物。
另外,食物与情绪之间存在强链接,高热量食物如甜食可以刺激大脑释放多巴胺,有助于缓解压力和提升情绪。毕竟,”晚来天欲雪“的天气,白居易下了班,也要“红泥小火炉,能饮一杯无?”。
随着气温持续走低,是选择“贴膘”,还是继续做控卡达人呢?
控卡首先是得掐着热量吃饭。
但没几天就会发现,算热量太累了。于是想到,AI或许可以一试。拍照让AI估算食物热量,管理自己的热量摄入。
iPhone发布后新上线的一键拍照调用 AI 功能也发掘出了这个思路。最近,跃问app因为针对iPhone16开发了一键调用相机接入 AI 提问的功能而火出了圈。
这一方面释放出AI场景化的控卡垂类用户信号,另一方面也考验着 AI 的图像分析能力。
话不多说,今天我们就来浅浅测评AI的食物热量估算能力,push一下图像端侧AI应用能力生长。
今天参与测评的选手则包括Kimi、豆包、秘塔AI和跃问。
Prompt为:假设我中午把这些都吃完了,请问我一共摄入了多少热量,附件图片如下。
我们先粗略估算一下参考答案。
图中是:
一份漏奶华,大约250g,总热量约400kcal;
一份叉烧饭,叉烧约100g,青菜约40g,滑蛋约50g,米饭150g,总热量约600kcal;
一份烤香肠玉米蔬菜拼盘,甜玉米30g,嫩南瓜70g,烤肠120g,总热量约400kcal;
一份咖喱鱼蛋,共6个,约120g,总热量约120kcal;
一杯港式冰奶茶,约200ml,总热量约200kcal。
图中所有食物热量约为1720kcal。
饿了吗?记住这份标答。
Kimi
首先是Kimi,大约10秒钟Kimi就交了卷。
首先,Kimi十分懂中国人的胃,不仅准确识别了食物名,热量估算也大致准确。把奶茶识别成了热巧克力,倒也情有可原。
这直接抬高了我对接下来测评的期待。
豆包
然后是豆包:
豆包的食谱显然需要丰富一下。漏奶华也许可以约等于松饼,咖喱鱼蛋也可以约等于蘸酱了的炸丸子,但是鸡蛋盖饭上的肉直接被无视了,和标答的热量差额也就出来了。
不过,豆包还贴心的给出了食物的方位。
秘塔AI
秘塔的回答则是:
这是目前为止唯一一个识别出烤蔬菜的AI。
秘塔正确识别了玉米、烤蔬菜、香肠、咖喱鱼丸、奶茶。
漏奶华也可以约等于巧克力吐司,但芝士培根饭的芝士颜色,是不是深了点呢?
此外,秘塔的回答简单明了的同时,也缺失了食物数量的描述,总体来说,我认为秘塔不善此道。
跃问
最后到跃问:
有意思的是,按照跃问的文本输出逻辑来推算,其他的AI都是从上到下扫描识别食物,但跃问是从左到右扫描识别食物,因此奶茶在第二顺位?这个细节所显示的,可能是底层程序的差异。
另外,从跃问给出的答案来看,它对食物的尺寸和比例没有概念,从而把漏奶华识别成了提拉米苏。
同样,跃问也没有给出食物的数量,都是一块、一杯、一份的总量词描述,对于图片中的同类项合并能力还尚待观察。
语言陈述方面,我也建议,可以试着更加 AI 一些,不要“我建议你”。
总结
Kimi在食物识别和热量估算方面表现较好,尽管有小错误,但总体准确。
豆包对方位更敏感,但需要丰富食谱库。
秘塔AI在识别多样性上表现不错,但在食物数量和份量的描述上有所欠缺。
跃问的图片识别逻辑可能与其他AI不同,对图片所显示的食物尺寸、比例、数量等变量显然不够敏感。
不同AI在图像分析和食物热量估算方面的能力各有所长,也显示在实际应用中的潜力和需要改进的短板。
总的来说,成为人类的生活助理,AI们还得加把劲儿。
如果你有观点、想法或想看的测评,欢迎和我交流。如果你喜欢这期内容,别忘了一键三连,因为这也是我探索更新的动力,我们下期再见~