扫码打开虎嗅APP
本文来自微信公众号: 太阳照常升起 ,作者:慕峰,头图来自:视觉中国
腾讯寄希望以10亿元红包去推广它的AI“元宝”,尤其是新推出的“元宝派”(类似微信群,不过里面有个AI机器人)。作者加入一个新创建的“元宝派”后,没到一个小时,这个“群”就“死”了,群内不再有任何信息。因为实在太无聊了,一堆陌生人加一个AI机器人,完全无话可说,不知道10亿元红包推这个东西是为什么。不推广,外界可能还不知道腾讯AI有多落后,一推广,就暴露了。如果是人类微信群,加入一个元宝机器人会怎样的,作者认为,绝大多数微信群可能都不会有这个需求。
很显然,腾讯在AI领域已经大幅落后了。
作者曾经分析过,国产AI,腾讯在数据质量方面本来是有天然优势的,这个优势就是微信公众号。但很可惜,腾讯的AI与公众号体系似乎一直分裂至今。从社科信息反馈来看,元宝目前的内容质量要比千问甚至豆包都要差很多,并且随着时间的推移,越来越差。
为什么会出现这种情况呢?完全是因为中文数据质量问题。
在元宝推出之初,整体数据质量还行,但随着使用量的增加,尤其是联网中文数据的污染,导致整体质量下降非常快。本来,作者认为,腾讯会打通自家AI与微信公众号体系,这样可以将高质量的微信公众号内容用来作为元宝中文数据的基础,如此一来,腾讯的AI至少在中文专业质量方面,将会大幅领先于其他国产AI。
微信公众号确实藏龙卧虎,也是中文文字内容生产方面唯一可与海外高质量平台媲美的中文平台。包括作者在内的不少微信公众号作者,都不太愿意在其他中文平台发布任何内容,这说明公众号平台确有其独特的优势。
然而腾讯至今却端着金饭碗讨饭。作者仅以本号为例,如果以“慕峰的主要观点”为问题,目前几家国产AI的反馈分别如下:
1、腾讯元宝
(1)元宝不联网Deepseek快速思考:慕峰是知名的国际法律师……事实错误,后面不用看了。
(2)元宝联网Deepseek深度思考:慕峰,亦作慕亚平,是知名的国际法律师、学者,中山大学法学院教授……事实错误,后面不用看了。
(3)元宝不联网Hunyuan快速思考:慕峰一般指旅美学者、自由派知识分子刘军宁……奇葩的事实错误,后面不用看了。
(4)元宝联网Hunyuan深度思考:慕峰(刘军宁)……奇葩的事实错误,后面不用看了。
要知道,作者以“慕峰”笔名在公众号写作已长达十年时间,虽然不是网红、大V,但只要接入公众号数据,甚至哪怕用其他搜索引擎稍微检索一下,怎么也不可能得出上述判断。这就是目前腾讯元宝AI的真实水平,完全没有任何使用价值,不要说社科研究,就是最简单的网络查询功能都是最差的。最有意思的是,元宝在联网状态时,竟然没有一篇参考文献是出自本公号,宁愿大规模引用其他平台的各种错误信息,也绝不引用自家公司的准确信息,可谓奇葩至极。
也正如作者此前所言,在过往,微信公众号其实是靠“口耳相传”的传播,令一些高质量的内容得以快速普及。但随着为了压制低劣信息传播的各种管控手段一刀切地实施(限流、控流、分流),又不采纳人工对高质量公众号进行标签处理给予流量支持,从而完美实现了劣币驱逐良币。与之相反,抖音对高质量账号的流量支持十分坚定,甚至不惜单独推出一款“抖音精选”APP。
2、阿里千问
(1)千问联网:慕峰(公众号“太阳照常升起”作者)是一位具有中央部委工作经历的观察者……这是唯一正确指出作者与公众号关系的回答,但关于作者身份的判断是错误的。此后的观点归纳,基本是准确的。主要原因是,千问联网检索虽然无法提取公众号的数据,但采用了信源度较高的“虎嗅网”的数据。虎嗅是迄今为止,但凡引用本号文章,都要单独向作者取得授权的。因此只要引用虎嗅的信息,至少可以部分归纳作者的观点。
(2)千问联网深度思考:慕峰(公众号“太阳照常升起”作者)是一位具有宏观经济研究背景的观察者……这是唯一既点出作者与本号关系,同时又没有给作者乱加身份的回答,在无法引用公众号数据的前提下,这个回答质量已经算最可靠了。
作者仅在腾讯的公众号写作,唯一准确答对作者网络身份的竟然是阿里的AI,舍得花10亿红包搞推广的腾讯高管们,要不要先扪心自问一下?
3、字节豆包
(1)豆包联网:慕峰(多为经济、戏剧领域评论者)……不能说错,因为网络上也可查询到有一位戏剧领域的专家也是这个名字。但后面的归纳过于简单。
(2)豆包联网深度思考:与上述类似,只是检索的网络信息多一些,归纳的内容再多一些,但总体是偏简单的。
作者认为豆包当前是偏生活化的AI,在中小学生辅助学习(尤其是音、视功能)、老年人日常生活辅助和旅游、出行、餐饮信息辅助方面,内容反馈质量都是令人满意的。豆包当前的路线并非专业化,而是偏生活化。
4、Kimi
无论是否联网,是否长思考(K2),反馈的内容都是:慕峰(本名刘胜军)……第二奇葩的错误,后面不用看了。
5、Deepseek
(1)DS不联网不选择思考:慕峰(笔名)是近年来在中文舆论场较为活跃的学者和评论人……身份回答没有硬伤,但归纳的内容基本不是作者的观点。
(2)DS联网并思考:慕峰(本名翟志勇)……第三奇葩的错误,后面不用看了。
基本就是这么个情况。
尽管作为生产力工具,国产AI正在被广泛赞扬,无论是写代码,还是短视频创作,都让人们眼前一亮。但在一些基础信息领域,错误已经不能用“幻觉”来形容。要知道,在Deepseek、元宝、Kimi诞生之初,它们的中文反馈质量是要显著高于当前的。
也就是,随着时间的推移,虽然烧掉了更多算力,但中文的反馈质量却大幅下降到几乎不可用的地步。如果你不追求质量和准确性,那让国产AI帮你写个学习体会、工作总结、做个花里胡哨的PPT也许是可以的,但真要较真,恐怕是难上加难。
当然,也有一些提升反馈质量的方法,也就是尽可能多地给出提示词,例如在特定研究领域,作者会让国产AI仅根据英文、日文、德文的专业数据库信源来反馈并以中文输出,并且每段反馈都要注明原始出处,这实际是以抛弃连接中文互联网为前提。那既然如此,为何不直接使用海外的AI呢?
作者本来寄希望于腾讯能够完美桥接元宝和高质量公众号数据库,让中文AI质量达到一个新的高度。但现在来看,元宝只能在中文的垃圾信息中遨游,直接位列倒数第一。
端着金饭碗,不但不要饭,还把饭碗给砸了,怪谁呢?
仅就作者身边而言,近年新注册的一批极高质量的公众号(都是相关领域一线的专家)非但得不到任何流量支持,反而被莫名其妙的极个别恶意投诉就删帖。多年来,腾讯也是唯一一个不主动接触作者,但又希望高度依赖高质量内容输出的平台。
元宝的今天,充分说明腾讯在AI时代正在面临溃败。一个弃自己的高质量数据不用,反而要高度依赖其他平台垃圾信息的AI,怎么可能有未来?
(一如既往的说明,作者不持有本号出现的任何企业的证券或证券衍生品,谁的股价又跌了,直接扪心自问就好)