正确的提示信息

扫码打开虎嗅APP

从思考到创造
打开APP
搜索历史
删除
完成
全部删除
热搜词
2023-01-13 10:22

机器人,困在赢不了利、落不了地

本文来自微信公众号:与非网eefocus (ID:ee-focus),作者:张慧娟,题图来自:《我,机器人》


机器人无疑是大赛道,不过2022年的机器人赛道,个中滋味可能只有从业者最清楚。


经历了两年多的狂欢,扫地机器人逐渐告别高增长,根据IDC预测,2022年市场出货量同比下降23.8%,市场压力陡增。相比之下,人形机器人在2022年颇受瞩目,戴森、特斯拉、小米……大佬赶集式布局。不过,重磅亮相之后,两极化的市场反响、对商业前景的质疑,不绝于耳。


如果说扫地机器人代表现在,人形机器人代表未来,机器人真正进入、并良好融入我们的生活,会比想象中更快还是更慢?从现在到未来,还有哪些难题待解?


“谁来保护我的隐私?”


“乱撞”“不智能”“扫不干净”……这些槽点后,扫地机器人最近又摊上了一个新“罪名”:泄露隐私数据。事情起源于《麻省理工科技评论》的一篇长文调查,曝光了国外某品牌的扫地机器人自带摄像头拍摄用户的事件,包括用户在家上厕所的动态,甚至人脸信息都清晰可见,都被拿去给AI模型做训练数据。这让用户对家中的智能设备再次产生了担忧:谁来保护我的隐私?


越来越多的扫地机器人转向计算机视觉,而为了让视觉导航实现更好的效果,就需要在更多高质量、多样化的数据集上对AI模型进行训练。在上述调查所提到的案例中,一些具体的物体、场景画面都被加上了标注,用以进行训练。这些隐私信息理论上应该处于非常严格的存储和访问控制之下,虽然公司本身没有泄露数据,却在交给第三方进行数据标注的环节出现了纰漏,被负责标注的员工分享到了网上。


摄像头让扫地机器人不那么智障的同时,却带来视觉数据特别是隐私数据被泄露的风险,这让AI应用再次触及到了“数据隐私”这条红线。


汪清在扫地机器人领域从事研发工作,他说,技术易实现,但法律合规却是一个绕不开的难题。如何防止隐私被偷窥、如何规避法律风险,成为产品落地时必须面对的问题。


当前,中高端扫地机器人基本都配置了AI摄像头,用于辅助识别物体并执行特定的清扫策略。然而,受到成本和算力的限制,AI扫地机器人只能满足辅助清扫的基本需求,因此,提升识别准确度、降低误识别概率,就成了产品的主要卖点之一。


那么,如何提高识别准确度?很重要的一环就是投喂量足够大、足够好的数据,来进行数据训练。对于商业公司来说,获得数据来源最简单直接的方式就是将用户数据上传到云端采集,经过训练优化模型后,再以固件更新的形式发布。


汪清指出,这其中可能就包括了隐私被偷窥的风险,也成为了产品进一步升级时必须面对的问题。一方面,消费者要尽量选择有保障的品牌产品,并且在使用过程中注重数字密码安全等问题;另一方面,也需要厂商提升设备安全性能、加强云端数据安全。但最重要的,是相关法律法规的不断完善,在此基础上的技术创新才能推动更为安全的数据生态。


机器智能,终极AI的最后一公里


人形机器人可以说是最符合人类理想的机器人形态,也始终在吸引着更大的市场兴趣。马斯克甚至认为,“当有一天我们解决了汽车的自动驾驶问题(即现实世界的 AI 问题)后,就可以将 AI 技术推广到人形机器人身上。这将比汽车具有更广阔的应用前景。”对于特斯拉机器人的定位,他表示,最初是替代人们从事重复枯燥、具有危险性的工作,但远景目标是让其服务于千家万户,比如做饭、修剪草坪、照顾老人等。


要真正让机器人走进现实生活中,还有无数个难题要攻克。除了技术、机械挑战,一个最为核心的问题还是人形机器人的“大脑”。市场上有研究者“拆解”了机器人的机械构造,发现虽然零部件是成本占比最高的部分,但“大脑”需要AI技术助推,是“把机器转化为机器人”的关键。


从AI大厂离开的李卓,正全身心沉浸在包括认知科学等在内的心理学研究中,他告诉我们,现阶段的人工智能仍以模仿人类为主,不论是计算机视觉、自然语言处理还是生成式AI(包括AIGC、数字人等),其内核还是算力、算法和数据的有效结合和应用。


放眼未来的人工智能,应该是有感知、有认知、会学习、自成长的机器智能。那么,如何才能实现这种更高阶的、或者说理想中的智能形态?


李卓指出,首先,人类属于碳基智能体,是一种具身智能;而机器智能属于硅基智能体,是一种人工智能,其生成来自于人类的大规模芯片制造,进化则来自大数据喂养下算法的快速迭代。


对于机器智能体来说,先天的不足,是其芯片组件往往来自人类的预先设计,一旦制成,在整个生命周期中无法动态修改,无法在环境的交互中动态优化。不过,随着芯片设计、封装、制造等技术的演进,包括chiplet、量子芯片等发展,机器智能体的计算方式也在发生变化,迭代进化速度将不断加快。


其次,人类的活动空间是宽泛的,既可以是物理空间,也可以是数字空间;而AI的活动空间是数字空间,要想对周围的物质或能量产生效果,需要通过传感器的采集和执行器的操作才能实现。更为重要的是,人可以通过移动从多个视角去感知所处空间,而机器人暂时还不具备这种能力,往往只能处在某一个场景简单的专业环境中,缺乏人类在通用环境中广泛的活动和社交能力,这是其局限之处。


第三,AI往往参考冯诺依曼架构进行计算,局限在数字空间,在解决特定问题时更高效,有一种“大数据,小任务”的感觉。


而人类的思考方式往往是感知-认知-运动类学习,大脑通过观察感觉输入如何随着运动而变化,去学习世界模型再去反应。其思维的过程就是数百亿神经元的活动,每个神经元都有数以千计的突出,与成千上万个其他神经元相连,人类所知的一切都存储在这些神经元的联接中。人类的思考往往具有一种“小数据,大任务”的感觉,通过分层分级,上一层的价值决定这一层的策略,比如基于一个人的价值观,就能大致判断出他的行动策略。


在可预见的未来,两种智能将走向融合,在物质的联网(交通网)、能量的联网(能源网),信息的联网(物联网&互联网)基础之上,将会形成智能的联网——也就是人类智能体和机器智能体的融合,并且这种融合将会逐步叠加、互相渗透,例如大脑、器官、义肢、神经元等,将形成更深层的融合。


“所谓的元宇宙,其实就是人类智能体和机器智能体共生的环境。”李卓表示,“在这个混合时空中,机器智能体从数字空间拓展到物理空间,伴生着人类进一步拓展更多个性化的时空,未来,如何构建共同的混合智能伦理和社会将成为我们面临的挑战。”


伴随着AI的发展,其实人类对机器人的感情,可谓是又慕又怕,人类既享受作为“造物者”的智力探索,又惧怕制造出有自主意识、不受人类控制,甚至反攻人类的恐怖对手。


就比如人形机器人,这种具有自主特点的机器智能体,一旦大规模进入社会生活领域后,将会很快进步、积累出世界模型的通用知识和底层逻辑,发展速度会非常快。那最终会不会出现电影《终结者》中的局面?马斯克的答案是不会,因为已经在设计过程中考虑到了这些因素,设计了很多安全保障,本地有停止按钮,可以终止它的行为,也可以通过远程控制进行干预。


未来,最终的智能形态将会主要受环境所驱动,就像大自然的平衡、生物多样性一样,人类智能和机器智能会共存。李卓补充说,比如在人类的活动空间中,还是人类智能主导和控制的智能形态;但是,假设拓展到星际智能、深海智能、地心智能……这些超出人类现存空间的领域,就更需要机器智能。


更智能的代价


知乎上有一个有趣的帖子,是关于那场著名的对弈——“AlphaGo和人类棋手比起来谁消耗的资源更多”。其中的一些讨论,也适用于对机器人落地的思考。


图源:DeepMind


在这场比赛中,一边是1202个CPU、176个GPU和100多名科学家在背后,另一边是一个人脑和一杯咖啡。这难道说明人脑效率远高于电脑、AI是靠着几百上千倍的能源消耗才取胜吗?


不全是。


时隔一年后,AlphaGo从内到外又焕然一新。内部软件算法升级,不再拘泥于人类棋谱而是自我对弈,比原先的暴力检索大大改观,几秒钟就能下一手棋;外部硬件核心全盘更换为Google新研制的TPU,这种专为AI而生的芯片在特定场合比CPU和GPU的性能有了极大提升,以至于与柯洁对弈的AlphaGo版本只需靠一台物理机上的4个TPU即可运行,而单枚TPU的设计功耗仅为40W。


仅仅一年,AlphaGo的实力又升了几个台阶,而功耗却缩减到千分之一,和人类几乎处于同一数量级。再过一年、五年、十年,将会怎样?


这可能就是人类在通往更智能的路上所需要付出的代价,比如:消耗多少能源、投入多少人才、付出多大成本、给予多长的时间周期……但最后都要回到一个终极问题上:场景在哪里?


就像把机器人比作一个刚刚踏入职场的应届生,你能给它找到一份什么样的工作?这是值得去进行思考的。


写在最后


机器人赛道难,难在哪里?难在顶不了天,落不了地。


像扫地机器人这样的新兴赛道,高速发展期过后,成本、受众、创新等问题都逐渐暴露眼前,都是对下一步拓展市场的挑战。而人形机器人这样的未来项目,自身的打磨仍需要足够长的时间周期,更需要找到适合大规模落地的实际场景。


工信部数据显示,过去两年我国机器人行业仍处于亏损经营阶段。尤其是2020年,规模以上机器人企业净利润同比下降26.9%,行业利润率仅3.33%。就连渗透率、普及率较高的清洁机器人、工业机器人赛道,尚且没有完全摆脱亏损。


在交流中,汪清说,机器人乃至AI落地的最大挑战,主要还是应用的客户和需求尚未明确。AI落地的第一波推动力量是学术界的力量、应用场景的突破以及资本的加持,再加上热点事件的助力,打响了产业落地第一战,也形成了广泛共识——技术成熟、可商业化,只要找到用户就可以形成标志示范效应广泛推广。


但是,这个阶段的AI公司没有盈利业务支撑研发,只能通过不断尝试不同行业场景下的落地实践,提供完整的交付并反馈才能完成落地闭环。人力成本、经营成本高,试错成本过高,也不得不依赖多次融资,反复打通场景更换项目来维持活跃性,这是AI初创企业在新场景落地面临的困难之一。


这不仅是人力成本和经营成本无法匹配项目营收的困难,也是项目定制化带来的成本高昂的泡沫。对于初创AI公司来说,获客成本高,对传统企业转型AI来说,更多是对现有客户的增值,特别是在服务碎片化市场客户的时候,比如细分的机器人赛道,这样的基础差别只会更大。


本文来自微信公众号:与非网eefocus (ID:ee-focus),作者:张慧娟

本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系 hezuo@huxiu.com
如对本稿件有异议或投诉,请联系tougao@huxiu.com
打开虎嗅APP,查看全文
文集:
频道:

大 家 都 在 看

大 家 都 在 搜

好的内容,值得赞赏

您的赞赏金额会直接进入作者的虎嗅账号

    自定义
    支付: