扫码打开虎嗅APP
头图来自海洛创意,未经授权,请勿转载使用。
由于一封文件的公开,维基创始人吉米·威尔士(Jimmy Wales)的脸被打地piapia作响。虽然此前猜测不断,但吉米总是一再否认维基百科会和谷歌竞争做搜索,公开发表声明说“这种建议是个谎言”。
但WMF(Wikimedia Foundation 维基百科基金会)显然没准备给大家留这个迟早要被撕破的面子。2月15日上午,WMF 公开了一封由奈德基金会( Knight Foundation)发出的文书。文书中明确,在去年 9 月,奈德基金会已经同意向 WMF 拨款 25 万美元,用于维基百科开发名为 “Knowledge Engine by Wikipedia”的搜索引擎的第一阶段。
根据pingwest报道中,提到Wikipedia 的公开邮件列表显示,整个搜索引擎开发项目将耗资 250 万美元,第一个阶段耗资 25 万美元只占到总项目用款的 1/10。项目将分为四个阶段,每个阶段都将持续大约 18 个月,项目总用时将长达 6 年。从预算报告可以看出,项目成员总共只有 8 名工程师,2 名数据分析师,4 名团队领导以及 1 位总监和 1 名副总裁。
据36氪引用的外媒 ABC消息,这份批复是去年9月作出的,只是最近才公布出来。 25 万美元用于维基百科知识引擎的一阶段研发工作,目的是促进信息查找的新模式。
新模式怎么做?
早前英国媒体The Register曾经曝光的维基百科“知识引擎”设计文档
对于新模式的解释是,这个知识引擎的目标是帮助用户通过互联网发现可靠、可信的信息。
维基百科的拨款申请中提到,商业搜索引擎统治了互联网搜索引擎的使用(根据 comScore 数据,Google 在搜索市场的份额为 67%,微软 Bing 为 20%左右,Yahoo 约占 10%),通过采用专利技术来控制对互联网知识和信息的访问。所以维基百科要推出自己的知识引擎来打破这种封锁。
其主要构思是:
提供出版物策展机制来保证质量,嵌入“来自运营商和原始设备制造商”维基百科知识引擎;
提供透明度,告诉用户信息到底出自什么地方;
开放元数据访问,让用户获取信息的确切数据来源;
保护用户隐私,通过严格的隐私控制来保护用户的搜索;
没有广告,确保信息的自由流动以及与商业利益的彻底隔离;
国际化,强调由社区来建立和分享信息;
是公开渠道,而不仅仅是现有百科全书知识体系。
不断的质疑与否定
维基百科正在开发搜索引擎的消息早前就有传出,也曾引起过严重的争议。
内部的反对
Hacker News 上的一个帖子指出,WMF 内部有大量反对这次拨款、反对维基百科开发搜索引擎的员工,因为本次拨款而离职。这是因为,这笔拨款的发放意味着搜索引擎的开发工作一旦开始,将没有回头的路。而现在看来,项目的开发工作早在去年 9 月就已经开始了。
维基百科编辑团队成员 Wittylama 在邮件中指责,基金会的执行董事居然会私下向外部机构申请经费,用于开发一个长达六年,耗资巨大、占用大量人力的搜索引擎项目,这样的行为简直不可理喻。Wittylama 指出,WMF 的项目文书中过度使用了“non-commercial”( 非盈利)这个词,真实的情况是基金会想要把这个搜索引擎打造成 Google 的有力竞争对手,而这个终极目标和“非盈利”之间的关系还有待商榷。
志愿者的担忧
以自由、效率、可信之名试图打造的新引擎,仍然不能掩盖维基想要借此赚钱的野心。不被商业所垄断不代表他不赚钱,直接来源于生产商的知识和数据,或许意味着一开始的植入,及时有审核,也表明志愿者们将失去对一部分话语权和控制权。这对社区志愿者来说更是一个重磅炸弹。维基百科也尽力在社区中引导:“他们(志愿者)曾被引导相信它只是一个中央搜索功能,让人们找到散落在各种维基媒体网站的信息。然而现在志愿者感觉WMF管理层有意将他们抛出圈子。”
与此同时,搜索引擎的存在地位,以及它与现有的维基百科主站之间的地位对比、依存关系等,也成为了编辑和用户社群争议的重点之一。显然,WMF 对搜索引擎赋予的重视程度,很可能意味着这个搜索引擎未来的重要性不亚于维基百科本身,甚至会高于维基百科。
做搜索引擎的执念
据《The Register》报道,现在已经公开的资料显示,维基百科对于这个搜索引擎的未来有着极高的期待:
Knowledge Engine by Wikipedia 将成为由 WMF 打造的,互联网上第一个透明的搜索引擎。
它(指搜索引擎)将会使媒介、新闻和信息的发现民主化——使互联网上最关键的信息更开放和更容易被获取。它将会成为这个被商业搜索引擎统治的世界上,第一个完全不被商业利益捆绑的开放数据引擎。
此前维基百科曾经有过做搜索引擎的尝试,但由于没有达到预期效果,2009年时创始人 Jimmy Wales 放弃了做 Wikia Search 的努力。
WMF 这次计划在未来通过运营商和 OEM (原始设备制造商)来植入这个搜索引擎。而在他们看来,这个项目最大的风险所在,是 Google、雅虎等竞争对手的干预,甚至做出跟维基百科一样的产品来。
真的如此吗?或许最大的风险还是来自自身吧,20人不到的团队,几百万美金和长时间的投入,都不像这个时期的互联网团队的运营节奏。更何况这个点子本身,更值得信赖、完全透明、非盈利的搜索,真的可信吗?