扫码打开虎嗅APP
听说国内开始用机器人写文章了?唔,反正本文是由虎嗅真人编辑撰写。
事情是这样的:今天上午腾讯财经发布了一篇名为《8月CPI涨2% 创12个月新高》的文章,本来稀松平常的一个文,却因为它文末的特别声明让编辑们都炸锅了。它是这样轻描淡写地声明的:“本文来源:Dreamwriter,腾讯财经开发的自动化新闻写作机器人,根据算法在第一时间自动生成稿件,瞬时输出分析和研判,一分钟内将重要资讯和解读送达用户。”
难道,嗅君的工作要不保了么?(虽说下面嗅君要介绍一系列机器人写稿的优点,但目前机器人稿件最致命的缺点就是无聊,所以请大家好好爱护我们人类编辑)
为此,嗅君专门去查了一下机器人写稿的现状,发现目前市面上比较有名的机器人编辑有两个。一个是Automated Insights公司的Wordsmith,美联社和雅虎在用;一个是《纽约时报》数字部门开发的Blossom,来看看他们的怎么用机器人写稿的
Wordsmith可以替人类编辑写财报和体育报道
腾讯财经首发了国内第一篇机器人写的稿子,把我们人类同行都吓得不轻,但你们知道么,美联社已经使用机器人编辑Wordsmith写稿超过一年了,不过貌似彼岸的编辑们好像因此解放了不少。
为什么这么说呢?其实美联社主要使用Wordsmith编发企业财报。在采用Wordsmith之前,美联社需撰写约300家公司的财报文章,可想而知这并不是个轻松的工作量。在使用机器人Wordsmith之后,美联社每季度可以出3000家公司财报,虽然其中仍有120篇需要人力更新或添加独立的后续报道,但显然它替人类编辑承担了绝大部分的工作量。
美联社之所以选择让机器人编辑承担财报工作,是因为该类文章内容往往单调枯燥,并且对数据的准确度和文章速度要求很高,这些都是人类的弱项。
所以美联社在去年夏天与Automated Insights(简称AI)公司达成合作,使用他们的Wordsmith平台自动生产财报报道的内容,以便让人类编辑可以集中精力到更有深度的采访中。
AI公司的公关经理James Kotecki称,Wordsmith平台每周可以写上百万篇文章,系统每秒甚至能生产2000篇文章。他们的合作伙伴还包括有美国好事达保险公司(Allstate)、美国最大的有线电视运营商康卡斯特(Comcast)和雅虎,其中雅虎的足球报道就是由Wordsmith自动编写的。
在系统试行前期,每篇自动撰写的报道都会再经过人工处理润色,错误的地方会记录下来并反馈给AI公司作调整。但从去年10月份开始,系统已经能够不经人工辅助,全自动生产内容。而听说目前机器人所撰写的文章,比以前人工编写的错误更少。
其实,目前Wordsmith的写作任务主要集中在一些客观的数据类报道,就如上文中美联社的财报和雅虎的体育报道,因为目前机器人还不能够编写出像人类写的生动稿件。尽管如此,仍有人类编辑想要挑战以证明人类的价值。NPR 的驻白宫记者,前任商业记者 Scott Horsley 就与WordSmith进行了一场较量。
比赛规则是:Horsley 和 WordSmith 一起坐等 Denny’s 餐饮公司出财报,两“人”同时开写一篇短报道,主要比稿件的速度和质量。
最终结果是速度上机器人胜:机器人2分钟完稿,Horsley 7 分钟完稿;质量上人类胜:机器人的文章获得912票支持,而Horsley的文章获得了9916票的支持。
有兴趣的朋友们可以简单感受一下机器人和人类的文风差异:(左侧为机器人版,右侧为人类版)
Blossomblot就是帮人类编辑找热文啊
不像美联社和雅虎选择和技术公司合作,《纽约时报》的机器人编辑Blossomblot完全是由《纽约时报》数字部门的科学团队研发。
Blossom的想法最初来自《纽约时报》副主编Alexandra MacCallum的灵感。因为编辑每天需要将文章往社交网站等平台进行针对性推送,但编辑很难每天从上百篇文章中,高效、准确、低成本地完成文章筛选工作。因此MacCallum主导开发了Blossom,通过办公协作软件Slack操控Blossom,再利用算法对Facebook等社交媒体上的海量信息进行数据分析。目前,《纽约时报》每天通过Blossom推送300篇文章。
跟Wordsmith不同的是,Blossom的主要职责并不是写文章,是辅助编辑挑选出潜在热文,已达到推送文章被病毒式传播的效果。目前根据根据纽约时报内部统计的数据结果显示,经过Blossom筛选的文章点击量是普通文章的38倍。
除了以上两个是比较出名的机器人编辑,还有不少也在民间服务着人类:《华盛顿邮报》在使用“Truth Teller”核实新闻的准确性;《洛杉矶时报》的员工设计了智能系统,专注处理地震突发新闻;路透社利用名为Open Calais的智能解决方案帮编辑审稿;《卫报》利用机器人筛选网络热文,生成实验性纸媒产品,每月发行5000份。