扫码打开虎嗅APP
文 | 寓扬
智东西(公众号:zhidxcom)
智能音箱江湖的火热程度已然有目共睹。自从亚马逊Echo去年年底在世界范围内大火了一把后,国内众多玩家纷纷涌入智能音箱这个新兴行业,从互联网巨头到传统音箱厂商,数百家奔向智能音箱市场的玩家正形成新的红海。
在这样的背景下,国内先后诞生了叮咚智能音箱、联想智能音箱、小雅AI音箱、天猫精灵音箱、小米AI音箱等一系列产品。而在这些产品背后,是整条智能音箱产业链的蓬勃发展:语音技术、芯片、核心部件、代工厂等等。
在此过程中,也涌现出了一大批智能音箱行业的标杆式代表人物,他们当中有的人见证了语音交互技术的迭代变迁、有的人占领智能音箱芯片的大半个江湖、还有音箱产业中备受尊敬的老兵前辈……他们以及他们的产品已确立在江湖中的地位,并获得广泛的影响力。智东西通过对产业链的分析探讨,梳理出了智能音箱江湖中的十大标杆人物。
他们分别为:景鲲(百度度秘事业部总经理)、浅雪(阿里巴巴人工智能实验室负责人)、毛华(腾讯物联云语音云总经理)、魏强(灵隆科技总经理)、王川(小米联合创始人、电视负责人)、胡郁(科大讯飞执行总裁、讯飞研究院院长)、游人杰(联发科副总经理暨家庭娱乐产品事业群总经理)、付强(先声互联创始人)、曾德钧(云动创想CEO)、李志飞(出门问问创始人)。
一、标杆人物的由来
在众玩家的涌入下,国内智能音箱产业链已基本成熟,智能音箱江湖中也诞生了一些标杆人物。但目前智能音箱由于语言和服务的障碍,还是一种偏向本土化的产品,因此本次论述的这些人物仅限国内智能音箱产业链中的玩家。
为了选出国内智能音箱江湖中的十位标杆人物,我们给出以下评判标准:首先,这位人物背景如何,是否是智能音箱相关项目的核心负责人;第二,该人物所做的项目究竟有何实力,在行业中拥有怎样的地位;第三,该人物及产品在行业中拥有怎样的影响力。
根据以上标准,我们选出了智能音箱江湖的十位标杆人物。下面就让我们看看这些标杆人物都有怎样的经历,又在智能音箱江湖掀起怎样的风浪。
二、国内智能音箱江湖的十位标杆人物
1、景鲲:赋能万物 打造AI时代的“安卓系统”
景鲲现在是度秘事业部总经理,百度人工智能产品委员会主席,全面负责DuerOS语音交互平台,直接向百度集团总裁&COO陆奇汇报。
2014年之前,景鲲曾是微软首席研发总监并负责微软必应搜索在亚洲市场的研发工作,也是微软小冰的打造者。进入百度后,先于百度核心部门大搜索任总产品架构师,负责百度大搜整体产品的规划、落地推进。之后在2016年10月,全面接手度秘团队。而在今年2月份,随着度秘团队升级为度秘事业部,景鲲及其团队在百度内部的地位也得到提升。
依托百度大脑,景鲲团队打造了DuerOS平台,其核心理念就是“唤醒万物”,包括小度智能设备开放平台、对话系统和技能平台,并收购专攻自然语言理解的创企KITT.AI,满足开发者“听清、听懂、满足”的需求,从而赋能万物。如小鱼在家的分身鱼、HTC U11手机、Ubee智能音箱搭载的都是DuerOS系统。
DuerOS平台在整个智能音箱产业链中具有重要价值,更多的开发者、内容提供商、供应链厂商可依托DuerOS打造自身的智能音箱设备,降低了开发门槛,或者成为DuerOS的组成部分,从而获得更大发展。
依托百度在语音语义技术上的优势,景鲲或将DuerOS打造成人工智能时代的“安卓系统”。
2、浅雪:智能音箱行业成熟的推动者
浅雪(本名陈丽娟)是阿里人工智能实验室负责人,主导了阿里第一款智能音箱天猫精灵X1和的人机交流系统AliGenie诞生。此前,她曾是淘宝第一任产品经理,还负责过阿里智能生活事业部。
天猫精灵也是目前国内的一款标杆性产品,在体验上打磨的比较细腻,充分显示了浅雪作为女性产品经理的角色。该款产品也和淘宝联动,可实现通过声纹识别进行购物。
在BAT互联网巨头中,与另外两家主攻平台不同,阿里则是亲自打造一款智能音箱产品,将整个链路跑通,并采取由爆款产品转向平台发展的模式。浅雪也向智东西透露,阿里人工智能实验室正在高速发展中,未来AliGenie平台也会采用更加开放的模式。
依托阿里巴巴,天猫精灵在购物和销售渠道上占尽天然优势。而阿里入局智能音箱对行业意义重大,它代表着互联网巨头对智能音箱的认可,能够快速培育行业,在行业中起到巨大的示范和推动作用。而浅雪及其天猫精灵推动整个智能音箱行业走向成熟。
3、毛华:手握腾讯优质内容的掌舵人
毛华是腾讯物联云语音云总经理,是腾讯云小微的打造者。
腾讯云小微也是腾讯内部的明星项目,是腾讯技术的顶尖代表,涉及腾讯内部六个团队的协作,而无疑毛华起到重要的协调作用,将腾讯的语音、视觉技术、内容服务都整合进“小微”。
小微是腾讯在今年6月份正式推出的智能语音开放平台,包含硬件开放平台、Skill开放平台、服务机器人平台三部分。硬件厂商只需要植入腾讯的SDK,就可以与小微进行对接,并使用小微的语音技术和内容服务。
小微正式开放以来,目前申请接入的企业已超200家,已经接入的产品有小Q机器人二代、飞利浦电视、亲见家庭语音助手等。
与百度阿里不同的是,腾讯在音乐、阅读、视频、新闻、动漫等泛娱乐领域拥有大量优质内容资源,而这些优质内容集成到小微上,使小微成为一个优质资源的聚集地。
智能音箱最后比拼的就是内容和体验,谁接入小微就意味着拥有了海量的内容资源,在内容上占得先机。而毛华就是手握海量优质内容的掌舵人。
4、魏强:国内第一款真正意义的智能音箱打造者
魏强是叮咚智能音箱的打造者,他是灵隆科技总经理,也是国内最早发力智能音箱的一波玩家。他原是京东智能产品总监,在亚马逊Echo推出后,一直对标亚马逊的京东联合科大讯飞成立合资公司——(北京)灵隆科技,魏强也被委任为总经理,充当智能音箱的探路者。
魏强团队在2015年8月推出国内首款真正意义上的智能音箱产品——叮咚音箱A1。经过近两年的打磨,叮咚音箱在内容和体验上均有较大进展,并在2016年达到近10万的销量。叮咚音箱也成为国内智能音箱的标杆性产品,成为后续打造智能音箱企业“庖丁解牛”的对象。
叮咚音箱是一款含着“金汤勺”出生的产品,一面是优质电商平台京东提供流量入口,一面是语音巨头科大讯飞提供技术支持。背靠优质资源的叮咚音箱,从一开始就在行业中占据优势地位,据魏强介绍,目前在智能音箱市场中,叮咚音箱占据70%的份额,引领了国内智能音箱行业的发展。
对于整个国内智能音箱行业而言,叮咚音箱是国内第一款真正意义上的智能音箱,它引领和培育了行业,而魏强则是国内第一款真正意义的智能音箱的打造者。
5、王川:开启小米音箱“价格屠夫”模式
王川是小米公司联合创始人、小米电视负责人。近期7月26日发布的小米AI音箱正是由王川领导的小米电视、小米大脑以及小米探索实验室携手打造的智能音箱产品,其价格为299元,再次扮演起“价格屠夫”的角色。
王川在小米AI音箱的发布会上说过,小米已经成长为全球最大的智能硬件平台,目前小米智能家居联网设备已超过6000万,并且还在高速增长,这么大体量的智能设备需要一个入口来控制。而小米AI音箱正是王川寄托的希望,希望它成为家庭的语音交互入口。
目前小米AI音箱已经面向米粉开启了“1元领养计划”,预计未来几个月内将正式发售。小米AI音箱再次像小米手机一样,扮演“价格屠夫”,成为智能音箱行业的“搅局者”,预计整个智能音箱的价格或将因为小米的涌入,而掀起另一波价格之战。
目前智能音箱还是科技圈的小众玩物,而小米音箱的涌入,或可能推动智能音箱真正平民化,使智能音箱进入平民老百姓中,从而推动大众对智能音箱的认可。可以说,智能音箱面向大众的普及,王川及其小米音箱功不可没。
6、科大讯飞胡郁:让语音技术引领时代发展
科大讯飞是一家令人尊敬的老牌智能语音公司,不仅是因为其多次在国际语音识别等大赛中名列第一,更因为其语音云平台从2015年10月至今年3月,累计终端数从6亿升到9.3亿,日均使用次数从10亿升到30亿,而第三方创业团队也从7万升到了了26万,在中文语音市场占据70%的市场份额。在智能音箱产业链中地位至关重要,堪称国内语音技术的行业巨头。
而胡郁是科大讯飞的一位重要人物,他是科大讯飞的十八个早期创始者之一,2008年6月至今,他担任科大讯飞执行总裁、讯飞研究院院长,负责主持公司语音合成、语音识别、自然语言理解等智能语音的研究工作。
胡郁总体牵头科大讯飞人工智能前瞻项目——讯飞超脑计划,其带领的科研团队在核心技术研究和产业化方面均取得了创新性成就,他本人也在2017年1月或由中央电视台等8家单位共同评选出的“2016年度创新人物”奖。
在智能音箱中,从远场拾音到语音识别、语义理解再到语音合成,包括声纹识别,是智能语音助手的核心,而胡郁及其研究院能够提供整套语音技术服务,赋予智能音箱大脑的功能。叮咚音箱的语音技术、麦克风阵列等使用的就是科大讯飞的技术。
目前其讯飞开放平台正面向智能音箱产业链提供这样一种角色,通过SDK开放讯飞的语音技术优势,赋予硬件智能化。截至2017年1月,讯飞开放平台在线日服务量超30亿人次,合作伙伴达到25万家,用户数超9.1亿。未来胡郁及其讯飞研究院将会在产业链中发挥更大的作用,引领人机交互的发展。
7、联发科游人杰:占领智能音箱芯片的大半个江湖
还记得阿里天猫精灵采用的定制语音芯片吗?没错就是联发科的MT8516专用语音芯片。
游人杰是联发科副总经理暨家庭娱乐产品事业群总经理。联发科下设两大事业群,一个是无线产品事业群,主要就是手机芯片业务;另外一个就是家庭娱乐事业群,主要为手机业务以外的产品,该事业群就由游人杰负责。在游人杰的带领下,其事业群的年增长率已经达到了20%左右,远高于半导体行业8%~10%的平均增长率。
游人杰曾谈到,亚马逊Echo目前使用的芯片就是联发科的芯片,联发科在去年崛起的智能音箱中占有近80%的芯片份额。目前,联发科与BAT等相关的公司也在积极合作,来获取智能音箱中更大的芯片市场份额,足见游人杰和联发科在智能音箱行业中具有重要意义。
而这款天猫精灵使用的MT8516语音芯片,采用四核处理器,主频达1.3GHz,该芯片还集成WiFi和蓝牙,集成度更高,芯片体积更小。它可支持8通道的TDM麦克风阵列接口和2通道的PDM数字麦克风接口,适合远场语音设备。被产业链人士称为国内同代产品中性能最好的语音芯片,兼具性能和性价比。
在国内,随着科大讯飞、思必驰、云知声等公司在语音识别技术上的成熟,以及BAT等互联网巨头的推动,今年年底国内将会推出更多的智能音箱产品。而游人杰也将会在行业中扮演一个重要角色,赋予更多设备计算能力。
8、先声互联付强:智能音箱拾音领域大咖
付强是一位声学领域的前辈,先声互联的创始人。而在这之前,他是中科院声学所的研究员,在中科院声学所有10余年的声学研究,在语音信号处理领域有20余年的积淀。付强是拾音领域的大牛,兼具学术和业界背景。
付强团队在国内较早从事了远讲语音研究,2006年和通用合作就涉及这一领域,在技术上拥有较深的积淀。其麦克风阵列将物理建模的信号处理与机器学习的数据建模相融合,从而将背景噪声、设备回声、房间混响等因素进行抑制,提供的麦克风方案包括双麦、四到六麦以及七麦以上的解决方案。此外,先声互联前端处理技术还支持更加灵活的麦克风阵列排布方式,也已通过了基于Alexa的AVS标准认证。
尽管付强在2016年才成立公司,但丝毫不影响其行业地位。先声互联是百度的合作伙伴,其麦克风硬件开发套件也在DuerOS平台中,供开发者使用。
目前,物灵的luka阅读养成机器人、极米科技的Lightank W100、数字家圆的亲见H2、360的巴迪龙儿童陪伴机器人等产品都采用了先声互联的远讲算法以及麦克风拾音模组。此外,先声互联也正在和腾讯、联想、小米等大公司就某些智能硬件产品展开合作。
在智能音箱行业中,远场拾音是重要的一环,尤其是噪音环境下的拾音也是一个亟待攻克的问题。随着智能音箱产业链的完善和扩大,对麦克风阵列和远场拾音的需求也会更大。而在拾音等声学领域有深厚积累的付强,将会是麦克风阵列领域最有代表性的企业家之一。
9、猫王曾德钧:智能音箱的行业顾问
曾德钧是音箱行业广为人知的一位老先生,60岁依然奋斗在音响创业的一线。尽管他本人并不做智能音箱,但是他在音响行业有着广泛的人脉和资源,是一位广受尊敬的行业顾问。
曾德钧是云动创想的CEO、猫王收音机创始人、聚匠计划发起人、互联网创客。他还是我国早期从事电子管功放研究的专家,Hi-Fi音响的先驱之一,被誉为“中国胆机之父”。士兵、老师、连续创业者、科学家、匠人、商人都是他身上的标签。
作为音响行业的老兵,曾德钧在做猫王收音机时,并没有跟风智能音箱,而是选择了蓝牙音箱作为创业方向,采用纯手工打造,更加注重产品和品牌。而正是这样一位老先生对智能音箱行业也有很大的贡献。互联网企业想要做智能音箱,而在硬件设备上打通产业链是关键一环,而曾德钧在音箱功放的研究以及行业资源无疑有利于智能音箱快速落地。
叮咚音箱的研发也有他的贡献,他还将这些经验传授给有需要的人。此外,他还向百度度秘推荐了自己的设计合作伙伴,共同设计了百度DuerOS的参考设计音箱。产业链人士称,曾德钧是一位景鲲、魏强都很尊敬的人,搞定这个人,整个音箱产业链都能搞定。
智能音箱在国内刚刚发展不到3年,在硬件、功放等产品的打磨上,还欠缺火候,正是需要像曾德钧这样的行业前辈帮助,赋予智能音箱更多硬件品质。
10、出门问问李志飞:软硬件结合将NLP技术落地
李志飞是出门问问的创始人&CEO,自然语言处理领域的专家,2012年创办人工智能公司出门问问,并获谷歌投资,其公司的核心技术为语音识别和自然语言理解。
在创办公司之前,李志飞是美国约翰霍普金斯大学计算机系的博士,之后在谷歌总部担任科学家,从事机器翻译的研究工作,这里面最核心的技术就是自然语言理解。
出门问问在今年4月份发布了智能音箱Tichome以及虚拟个人助理“问问”。李志飞谈到,问问音箱将在本月底上市,它可以展开基于上下文背景的多轮对话,比如你可以说“播放音乐”,然后可以接着问“这首歌是什么名字”、“歌手是谁”、“他结婚了吗”等更深度的问题,在多轮交互和NLP技术上比市面产品做得更好。
李志飞还推出AI开发平台,通过出门问问语音交互的SDK,提供热词唤醒、语音识别、语义理解、垂直搜索、语音合成等技术,供开发者使用。
智能音箱之所以智能,是因为智能语音助手的存在,而目前语音助手发展的核心瓶颈就是自然语言理解和对话系统上。尽管我们距离真正的“智能”还有很远的距离,但两者的突破在于怎么能有效的把NLP技术和知识图谱、推理的结合。
而李志飞及其问问团队正是国内NLP技术的代表之一,其在NLP领域的进展,将推动整个智能音箱行业更加智能化。
三、智能音箱江湖的其他豪杰
除了以上十位智能音箱的行业标杆人物外,还有一些行业人士尽管没有入选,但在行业中也具有不俗的影响力,如DeepBrain的CEO何永、三角兽创始人&CEO王卓然、思必驰创始人高始兴以及喜马拉雅创始人&CEO余建军等。
DeepBrain的CEO何永的状况则略显悲观,其在叮咚音箱之前就推出了小智超级音箱,算是国内智能音箱早期的开创者, 但因为技术体验、渠道以及市场成熟度等原因,并没有取得太多成功,这也是一家创企很难破的瓶颈。何永也在打造语义技能商店,作为自己的差异化之路。
王卓然是三角兽的CEO,伦敦大学的博士生,主攻智能交互和机器学习,2015年曾负责百度度秘人机对话和中控决策系统,还和另一位创始人领导度秘的人机混合团队。其公司成立于2016年,也是一家NLP领域的明星创企,基于NLP为各个领域打造人机交互解决方案,百度、小米、锤子、Rokid、腾讯、微软、新浪等都是其客户。
思必驰是高始兴创办的一家语音技术公司,成立于2007年。近期思必驰也是智能音箱圈广为议论的话题,其语音识别和麦克风阵列广受欢迎,联想智能音箱、阿里天猫精灵、小米音响等都使用其方案。近期思必驰还推出DUI开放平台,可进行一站式对话定制,从而提供语音技术服务。
喜马拉雅余建军则是由内容商向智能音箱进军的代表企业家之一,其联合猎户星空、洛可可、佳禾智能在今年6月20日,推出小雅AI音箱。从内容到智能硬件之间,是一个大的尝试,作为一家没有硬件基因的喜马拉雅则采取了“抱团取暖”的策略,争夺未来语音交互入口。喜马拉雅这种模式也将会在智能音箱行业起到一定的示范作用,即明星团队或者中小创企如何联手布局未来。
前阿里巴巴M实验室负责人祝铭明 2014 年 7 月离开阿里巴巴,创立 Rokid,2016年4月,他所在的Rokid开始小批量生产搭载智能语音助手的终端。Rokid是国内较早涉足这一领域的公司。智能终端所搭载的语音平台可能是物联网时代的服务分发角色,它或许会颠覆基于硬件和屏幕的交互模式。
结语:下一代豪杰在哪里?
智能音箱在国内近3年的发展,产业链已基本成熟,并诞生了一批标杆人物。他们是智能音箱的先行者,较早发现先机,从产业链某一环节切入,试图最大程度参与未来入口的争夺,成为时代的弄潮儿。
各家纷纷推出智能音箱产品或者布局语音平台,一场关于音箱的“百团大战”即将上演。而智能音箱在语音技术、内容、服务、家居标准等领域还存在广阔的机遇,下一代智能音箱江湖的豪杰又会在哪里?
(注:以上排名不分先后)