正确的提示信息

扫码打开虎嗅APP

从思考到创造
打开APP
搜索历史
删除
完成
全部删除
热搜词
想走出会议黑洞,不能全指望人类

特别策划

2022-07-25 18:26


《生生不息》是高通联合虎嗅打造的系列报道,旨在关注不确定的环境中,新兴技术如何在企业的通力合作下,冲破重重阻碍,焕发生机的过程。展现“连接+计算”对万物之价值,勾勒各行各业从业者对数字中国之思考。


人的一生中,开会的时间,远超过预想。


《开会的革命》中写道,在职业生涯中,普通职员起码有9000小时用来开会,约375天,也就是说,差不多整整一年不眠不休,被用于了开会。


如果级别再高一点,根据统计,在中国企业的管理层中,开会占据了整体工作时间的近50%。


自疫情以来,人们开始线上办公和混合制办公,开会时间变得更长。国外学者在研究微软员工的会议表现后发现,“远程开会时,至少四分之一的会议参与者进行多线工作,比如:边开会边回邮件、写文档甚至锻炼,且时间越长、参会人数越多的会议,分心的可能性也就越大。”


他们甚至统计出了一组数据,80分钟以上的会议分心的概率是20分钟的6倍,10人以上的会议分心的概率接近1对1会议的3倍。


大公司更容易因为会议冗长、参与人数众多导致传达效率低下。尤其在大型会议中,当会议空间太大,参与人数众多,甚至部分员工需要线上接入时,过往面对面的空间协同感被打破,会议的氛围感降低,参会者更不容易专注,尤其当会议的镜头只对准中心区域,以一个视角直播全程时,大部分人都会产生“与我无关”的游离感。


除了升级开会的方法论,会议设备能做什么改变,让参会者更容易投入?



人类历史上,专为会议研发的技术系统诞生时间并不长。1961年一家德国公司将原来会议话筒的并行连接方式改为串行手拉手的连接方式,才开启了会议系统这一个全新的品类。


 一直到1996年,国内才有公司通过模仿和借鉴进口品牌,进行会议系统的研发和生产。没有会议系统的时代,几只麦克风、两个喇叭就能开一场大会。



到第一代会议系统,也就是业内人称“手拉手会议系统”的阶段,声音仍旧占据主导位置,但环境抗干扰能力都得到了提升,会议终于进入了有序时代。


但人类的交流过程中,只有33%-38%依赖于声音,55%-60%依赖于视觉效果,这就使得在投影技术更发达后,图像和视频走入了会议系统之中。



70、80后的职场人们,可能不会忘记:每次开会前,专门的调试人员走入会议室,连接各种音视频的转接线,领导和员工们默默在旁等待,再三调试后,确认画面、音频一致,会议才正式开始。


根据调研机构奥维云网的统计,在中国总共有2000万间企业会议室,其中,拥有视频会议功能的仅10%,能够召开一场高清、稳定视频会议的不到5000间。


这个数据放在今天着实有些不可思议,而对于推动企业数字化的公司们而言,却是一个不错的切入口。


从改善会议体验开始进行企业数字化,首先要知道一场会议有哪些痛点?



传统线下会议,实际上是人们在空间和时间上的协同。当人们处于同一时空,对于注意力集中有着天然的优势。疫情期间,每个人都在线上办公,各自对着手机或者电脑说话,画面和声音的清晰度大致在一个水平上。


但当一部分在现场,一部分从线上接入,此时电脑、手机就不再适用,画面的采集和拾音就成为核心问题,甚至我们还需要在会议中圈圈划划、投屏等等,这就需要专业的视频会议设备。



事实上,市场近两年对会议设备的需求正处于急速增长阶段。


IDC预测,中国视频会议市场规模在2024年将超过100亿元人民币,云会议市场占比将近40%。由于疫情防控的常态化,以及非接触商业的兴起,中国视频会议市场将进入新一轮的增长周期。


由于市场潜力巨大,国外的互联网大厂如谷歌、Facebook等,纷纷推出了“会议神器”。而在国内,钉钉是最早看到会议硬件需求的厂商。


在研发两年后,钉钉认为:符合人们需求的会议设备,首先应该高度集成化、部署简单、使用简单,主机、摄像头、麦克风、音响全部集成在一起,不需要长篇大论的培训,普通员工就能操作。


其次,应该具有很高的性价比。不论是大客户还是中小客户,都能够快速将普通的会议室升级成视频会议室,尤其在会议软件已经相当普及的今天,软硬件结合才能给用户带来更智能化的体验。


2020年5月,钉钉推出了针对小会议室的会议一体机F1。2022年,在F1的基础上又推出了针对中大型会议室的F2,并且明确表示了硬件的全面生态化,而这款F2将会以模组的形态,拆分成多项插件,开放给钉钉的伙伴集成。这意味着,F2更像是打了一个样,告诉伙伴们会议硬件还可以做成这样。


高度集成化、高性价比和软硬件结合,也是会议设备厂商们近些年的整体进化方向,但这些并非F2最大的“底牌”,它的特色在于为中大型会议请来了一位“智能编导”。


为了提升会议的“参与感”,F2为此找到了一个“特写”解决方案,它采用了四千万四摄镜头组,结合AI图像增强技术和多维智能导播算法,在线下会议室可以无缝覆盖10米距离,将每个角度都高清呈现,互动过程中,可根据会议室中的人员分布,自动调整画面最佳取景。



对边说话边移动的发言人,F2将自动跟踪目标并持续调整画面,将发言人一直锁定在画面中心;针对对话场景,设备支持智能双人对话识别,可以在画面上呈现出双人特写的分屏对话,模拟临场沉浸式体验。


F2将这种功能命名为“多模态的发言人特写”,它体现的是一种“看见即存在”的心理学理念,因为给予参会者更多的关注,让他们更容易被听到、被看见,进而被组织所发掘,会议更容易发挥集体智慧。


事实上,过往的会议设备并非不想实现智能化,提升参与人员的使用体验和沉浸感,但传统会议设备,wifi、AI、视频、音频等功能都是由不同电路板上的硬件分开实现的,调教复杂且占空间多,造价还非常昂贵。



“多模态的发言人特写功能”之所以能够实现,首先需要通过高精度的声源来定位,在10米内找到发言者的方位,其次视频也要能够分辨场内所有的与会者,定位发言者与其他重要人物,呈现出特写画面。


这些智能化功能的实现,往往要经历:感知、决策、执行这三个主要步骤,每一步都涉及到会议设备的两个底层能力:连接、计算,这正是高通的专长组合。 

 

F2的智能化进阶,源于其搭载的高通物联网芯片,提供了包含8个Arm的CPU核,多达7路摄像头并发的强大的ISP系统,以及GPU子系统和高达15T (15TOPS, 每秒15万亿次运算)的综合AI计算能力。

 

芯片对于会议设备有多重要?

 

以视频为例,传统的会议设备,一颗镜头对应一颗ISP,三颗就要三个ISP,每个镜头和ISP之间要分别调试画面效果使之一致,成本和开发难度都很高;但一颗高通的物联网芯片,就能支持多个ISP,手机上早已实现的三颗摄像头同时摄录,在F2中也得到了应用。

 

此外,无论是多模态的发言人特写功能、音视频融合,还是AI降噪都需要大量的算法,云计算无法满足其对时延的要求,而高通提供了多达15T的算力,为一场沉浸式的会议提供了强有力的支撑。



会议设备真的有必要装上物联网芯片吗?

 

2021年,扎克伯格提出元宇宙概念的第一个视频,场景设定在了一场线上会议,在元宇宙里,人们需要戴上VR眼镜,拥有一个虚拟形象,然后才能感受到和线下一样的体验。

 

毫无疑问,人们对于现场感和沉浸感的追求越来越迫切,但元宇宙还太遥远和梦幻,人们想要在当下就享受到最便捷和智能的科技服务,只能仰赖AI、云计算、5G和边缘计算等技术。

 

会议系统对于企业而言,是一种生产力工具,只有跟经营模式相匹配的生产力工具,才称得上好用,而搭载高通物联网芯片的F2,解决的正是疫情防控下,企业面临的生产效率问题,和过去一直未被妥善解决的痛点。

 

事实上,会议只是“万物互联”的场景之一,类似会议这样需要被连接和重构的场景非常多。


过往人们强调物联网的发展时更喜欢用IoT的概念,也就是Internet of Things,在这个阶段厂商们为硬件设备增加了各种类似于蓝牙、互联等功能,但高通已进化到了AIoT的时代,A代表着Artificia(人工智能)。

 

AIoT时代,算力从云端开始下沉,一直下沉至边缘侧和终端侧。

 

这是因为人们对延时的容忍度越来越低,比如手机美颜、智能机器人、会议设备都需要立即给出结果,终端侧能够实时完成计算。


另外,人们对于隐私的要求也越来越高,一些个人数据最好不需要传到云计算中心,在本地完成采集与分析,更符合安全需求。

 

无论是F2中的实时跟踪和放大功能,自动驾驶中的倒车与寻路、送餐的机器人、无人机等,这些场景中的终端设备,都在安装高通的物联网芯片后,打通了“万物互联”的最后一公里。

 

用一颗物联网芯片,解决终端场景中音视频和人工智能的需求,俯瞰高通的整个布局,我们会发现,他已经完成了从计算芯片到5G、蓝牙连接技术,再到终端侧的物联网芯片的整体性规划,率先一步看到了人与万物智能互联的未来图景,为此积累了包括终端侧的高度智能化技术与海量物联的连接技术,最终在各行各业产生了广泛而深刻的影响。

 

当下的数字化基础与物联网仍旧处于早期阶段,但随着一个又一个的终端布局,高通已经成为物联网的“大脑与神经”,通过连接与计算,让数字世界更智能、更具生命力。


本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系 hezuo@huxiu.com
如对本稿件有异议或投诉,请联系tougao@huxiu.com
打开虎嗅APP,查看全文

大 家 都 在 看

大 家 都 在 搜

好的内容,值得赞赏

您的赞赏金额会直接进入作者的虎嗅账号

    自定义
    支付: