正确的提示信息
扫码打开虎嗅APP
从思考到创造
打开APP
资讯
视频
前沿科技
车与出行
商业消费
社会文化
金融财经
出海
国际热点
游戏娱乐
健康
书影音
医疗
3C数码
观点
其他
榜单
虎嗅视界
24小时
妙投APP
虎嗅智库
登录
极速注册
取消
搜索历史
删除
完成
全部删除
数码
互联网
数码
互联网
热搜词
阿里巴巴
西餐
消费降级
李显龙
特斯拉
Google I/O
青年教师
广告
毕业生
账号或密码错误
2014-01-06 16:55
Netflix是如何向4000万用户精准推荐电影的
爱范儿
虎嗅注:本文来自
爱范儿网
,虎嗅进行了相关编辑。
在信息爆炸的时代,智能推荐应时而生。内容提供商能够对用户的爱好做出更为细致的分析,从而做出更加个性化的推荐。
Atlantic网站的Alexis C. Madrigal
通过对Netflix影片分类的深入分析以及采访Netflix产品副总裁,揭示了Netflix影视推荐背后的真相。
外界的解读:语法
Netflix推荐影片的时候,会给出一个非常细致的类型,或者说是一种“微类型”。Alexis 想要整理出一份完整的微类型列表。由于Netflix的微类型多得离谱,他不得不借助于自动处理软件。在计算机连续运作一天之后,他看到了Netflix微类型的数量:76897个。这些微类型是由一些基本要素构成的,基本语法是这样:
地区+形容词+类型(名词)+基于……+……为背景+来自……+关于……+从 X 岁到 Y 岁
(Region + Adjectives + Noun Genre + Based On… + Set In… + From the… + About… + For Age X to Y)
当然,有些微类型是不符合上述语法的,比如“有强势女主角”和“适合无可救药的浪漫主义者”。
在同事Ian Bogost 的建议下,Alexis还编写了一个类型生成器,试图理解Netflix的算法究竟是什么样子的。不过,他还是感觉没有看到全貌。于是,他联系了Netflix,并见到了公司的产品副总裁Todd Yellin,那个创建了 Netflix 推荐系统的人。
内部的解答:内容撕裂、量子理论
在接受采访的时候,Todd Yellin说,他早就等着人们来问这个问题了。为所有的电影加上标签,正是他的主意,而他还自己写了一张24页的文档,讲述加标签的方法。他为早期的一些电影加过标签,而且主导了整个系统的创建过程。
“我的第一个任务是:把内容撕裂开来!”他说。
2006 年,Yellin组织了十几个工程师,花费数月时间编写一份名为“Netflix 量子理论”的文档。当时,他把组成影片的基本元素称作“量子”。如今,他更喜欢“微标签”的说法,因为现在看来,“量子理论”是一个自命不凡的名字。
这份文档描述了为影片各种层面加标签的方法,涉及影片结尾、主角的“社会接受程度”等等方面。标签是标量的,从1到5,就是说,所有的影片都有一个“浪漫程度”的标识,而不仅仅是那些表明是“浪漫片”的电影。每个电影的结局都有打分,从幸福到悲伤。每个情节都有标签。主角的工作有标签。影片的地点有标签。
Netflix的工程师以“微标签”为基础,创造了一种语法,来生成各种类型。这是一种人工和机器算法的结合。Netflix 的做法,与 Pandora 的音乐基金组计划有些类似,但是 Netflix 不仅仅展示给你喜欢的内容,还能够对其进行文字描述。
这些标签数据不仅仅用来生成类型,也用来增加推荐的个性化程度。如果你喜欢动作冒险类电影,并且浪漫程度比较高的,Netflix 可以推荐给你。“我们将对影片中的浪漫程度做出标注。我们不会告诉你它有多浪漫,但是我们会推荐它,”Yellin 说,“你会看到动作场面,里面的浪漫程度如何,那取决于我们对你的了解。”
算法的哲学思考:是失误也是特色
在采访结束之前,Alexis 向Yellin展示了一个有趣的图表。Netflix上最受欢迎的演员排名中,第一名的是Raymond Burr,50 年代电视剧
Perry Mason
的主演,而第七名的是Barbara Hale,在剧中扮演主演的秘书。为什么这两个人能够超过梅丽尔·斯特里普、塞缪尔·杰克逊、尼古拉斯·凯奇和肖恩·康纳利?
这是一个谜题。即使是Yellin也搞不懂,为什么他们的名字出现在那么多的“微类型”中。这是无法用逻辑来解释的问题。
“让我们做些哲学思考吧。在人类社会中,生命由于意外而变得有趣。”他说,“当你把复杂的东西添加到机器的世界时,你也在添加自己无法想象的意外。
Perry Mason
就会发生。这些机器中的鬼魂,经常是复杂带来的副产品。有时候我们称它为失误,有时候我们称之为特色。”
本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系 hezuo@huxiu.com
如对本稿件有异议或投诉,请联系tougao@huxiu.com
打开虎嗅APP,查看全文
频道:
游戏娱乐
支持一下
赞赏
0人已赞赏
分享至:
0
大 家 都 在 看
来认识一下这些基于好友关系链和算法推荐的电影发现产品
虎嗅
12:49
#内幕大揭秘
0行代码年薪百万,招这种工程师的公司是怎么想的?
量子位
Facebook对用户接受信息的算法规则进行了重大调整
虎嗅
雅虎和微软计划联手拍摄电视剧——这主意不赖
虎嗅
美国新片公映两周后中国就能看了,这是一列好莱坞大片直通车吗?
虎嗅
ChatGPT 的横空出世,Google 或将遭遇危机|荐读
赵赛坡©
ChatGPT 爆火之后,阿法狗团队拿出了一个王炸产品
爱范儿
“亲爱的女儿,我们不必害怕算法”
看理想©
事物如何变得流行?
经济观察报观察家
社交网络正在吞噬人类脑干,令我们欲罢不能
全现在
AIGC之后,让我们实现镜头自由
糖总总
08:45
错误、偏差、歧视……算法偏见,不就是人性的偏见吗?
造就Talk
46:21
#AI有多智能
深度商业分析:AIGC赛道风口来了?
李自然说
07:00
#AI有多智能
令马斯克都害怕的ChatGPT,真能干掉谷歌吗?
知未科技
01:24:18
#AI有多智能
AI孙燕姿翻唱周杰伦的《发如雪》,版权归谁?
潘乱
06:51
#AI有多智能
画作拿下绘画比赛冠军,画师们急了,AI赢麻了?
知未科技
06:04
#AI有多智能
12款中美大模型评测,国产AI更适合打工人?
娱乐资本论
12:58
#高新技术流
专业解读MOSS和ChatGPT精髓,精妙设定细思极恐
极客队长GeekLead
25:37
#AI有多智能
AI遇上元宇宙:人类失去的是枷锁,解放的是整个精神世界
酷玩实验室coollabs
15:28
#AI有多智能
AI迎来觉醒时刻,中国遭遇最严峻的封锁
酷玩实验室coollabs
大 家 都 在 搜
阿里巴巴
西餐
消费降级
李显龙
特斯拉
Google I/O
青年教师
广告
毕业生
APP内打开
好的内容,值得赞赏
您的赞赏金额会直接进入作者的虎嗅账号
自定义
支付:
元
匿名赞赏
支付