扫码打开虎嗅APP
本文来自微信公众号:扯氮集(ID:weiwuhui_com),作者: 魏武挥。
01
28日下午,我应上海社科院新闻研究所邀请,参加了一个小型讨论会,主题是“何为优质在线内容”。
通俗地讲,就是“什么叫好内容”?
这个问题看着简单,其实仔细想想,是能够想出一个细思极恐的结果的。
02
非常巧,27日中午在微信上,我和馒头大师关于好内容这三个字还唇枪舌剑了一番。
这位游戏爱好者感叹《荒野大镖客2》的盛况:上线一周狂卖800万套,营收5亿美金。这部游戏研发历时8年,投入8亿美元,但馒头大师认为大赚是没有悬念的:预计能卖出2000万套。他又举了一个《GTA5》的例子,这部神作卖了9500万套。
他的结论是:好内容不怕等,也不愁卖。
我的问题是:什么是好内容呢?魔兽世界这部电影在中国票房是不错的,但却输掉了全球票房。它算好内容吗?
馒头大师“好内容不怕等也不愁卖”这句话,总给我一种以结果定义“好”的味道。假设《荒野大镖客2》卖了800套,算好内容吗?
不过,这种问法也有很纠结的地方:如果不好能卖那么多吗?
有时候我们还会碰到这样一种情况:一个内容刚刚出来时,既无叫好也无叫座。但过了N年后,却成为“神作”——优秀内容。
典型的例子就是:周星驰的大话西游。
影视剧、游戏,都是非常复杂的“内容”,我们退一步,先说图文类内容。
到底什么叫“好”呢?
03
点击量。
很遗憾,的确点击量就是度量内容好坏的指标。
用结果倒推好坏,在当下,恐怕是最硬的客观证据。
但这里还要再做精细化工作,点击量需要分类。
读来非常轻松的短篇娱乐报道,和严肃的长篇某上市公司深度调查,他们的点击量比较是没有意义的。
目标人群不同,以及,很重要的,阅读目的也不同。
但我想,既然内容文本可以做“颗粒化”工作,受众也是可以做“颗粒化”的。
我们甚至可以发现,一个被公认为有眼光的人(比如马化腾),和一个不过尔尔的人(比如魏武挥),在同一篇文章上的阅读行为(例如阅读时长,例如是否反复上下拉动以表示在仔细阅读与否,例如是否分享甚至包括分享时所加的一段简单短评)。很显然,我们要为前者的度量加一个权。
在大数据面前,按照不同维度进行分类的点击量比较,总是有操作路径的。
无论怎样繁复,恐怕好内容在结果上,是可以度量的。
04
读到“从结果倒推内容好坏”,如果你还能表示同意的话,那么再往下一步,还有一些惊悚的推论。
我们可以根据大量的内容度量的指标,从而发现这些被视为“好”内容的共性。
换而言之,我们能找到“好”内容的生产方法。
请允许我用一个文科生看到就皱眉的词:算法。
好内容的生产是可以有算法的。
其实,经验就是一种还没有数据化的准算法。把经验变为算法,我并不觉得是什么完全不可能的事。
棋手下棋,是要讲经验的。
我们已经成功地将下棋经验变成算法,最后击败了人类。
司机开车,是要讲经验的。
但我们正在努力让司机的经验,变成“算法”。自动驾驶现在已经走到了L3的阶段。
如果把生产内容这件事往AI上靠,类似自动驾驶,大概也是能分出所谓L0一直到L5的阶段的。
在一些很简单的内容生产上——比如财经数据播报——机器人新闻走到L3阶段应该是没有疑问的。腾讯的Dreamwriter在三年前就已经浮出水面了。
撰写一篇评论文章,为什么不能有算法?
有足够多的数据能建立真正的内容访问量指标(而不是大而化之仅仅比较十万加还是九万加),就一定能找到所谓“好”内容的算法。
05
和家父魏永征教授讨论这个事。
我提到唐诗宋词这种对今人难度很高的内容创作,我认为调教AI写唐诗宋词比调教其写散文容易得多。因为唐诗宋词讲格律,算法比散文清晰。
家父表示了不同的意见。在他看来,格律诗乾隆大帝写了数万篇,也不能和李白杜甫辛弃疾李清照相提并论。
我在同意之余,却认为,在大部分阅读的场景下,我们要的不是艺术品(李杜辛之类),只是普通读物(乾隆的水准就可以了)。
艺术品大概还是人类的势力范围。
家父又提出,好内容对人类的情感是有影响的,而人类情感,计算机恐怕很难理解。
不能理解不是问题,关键是能不能掌握影响情感的方法(至于这个情感到底是什么,不知道也无所谓)。
我们已经略略看到了一种经验的复制可能性。
比如那篇刷了屏的锦鲤文章,有人发现,写作者是著名情绪调动高手迷蒙的实习生(有可能是助理)。也就是说,咪蒙的方法是可以复制的。
事实上,咪蒙本人对她的经验也有一定的归纳。
当然还是经验范畴,不是算法范畴。
但这一步真得很难么?
06
回到问题本身:何为在线优质内容。
如果这个问题有解,那么,人类将再次向计算机拱手交出自己的一块地盘。
探讨在线内容的优劣,其实就是在摸索优质内容的标准,其实就是在摸索优质内容的方法,其实就是在摸索优质内容的算法。
这一步一步下去,终将使得大学取缔中文系,取缔新闻系。
当然,我承认,找人采访挖料这种事,计算机大概干不来。
但人类就变成了AI厨师的下手:把料准备好。往算法里一灌,好内容立刻生成。
这个意义上讲,新闻专业还是要的,但大概高职就够了吧。
07
“千人千面”这四个字,诸位可能是不陌生的。
我们平时讨论的“千人千面”,更多意义上是传播向的。内容是人工生产的,算法根据你的一些特征,有针对性地分发内容给你。
我们设想这样一种情况。
我对某事感兴趣,当我输入关于这个事的关键词后,算法自动生成一篇我认为是“好”内容的内容。
如果再进一步,算法连我输入这个动作都不需要,直接就可以推送我感兴趣的且我认为叫“好”内容的内容?
有那么点AI“洗稿”的意思。
我有生之年看得到这种“盛况”么?
08
希望能看到扎实的反对意见。
本文来自微信公众号:扯氮集(ID:weiwuhui_com),作者: 魏武挥。