新疆都市报 > 科技 > 智能 >

小度智能音箱23亿语音交互背后的价值演变

发布时间:2020-02-29 23:40来源: 网络整理

  百度刚刚发布了2019年全年及第四季度财报,总营收1074亿人民币、单季营收289亿人民币,除了营收上继续保持双向增长,人工智能新业务也展露出一些新气象,并首次对外披露了这样一组数据:小度品牌第一方硬件的语音交互次数达到23亿次(智能音箱、车载支架等),是去年同期的7倍多。

  其实早在2018年第三季度财报时,百度就曾对外公开DuerOS(小度助手)的相关数据,不过彼时的数据主体还是DuerOS生态,TCL、vivo、索尼等合作伙伴的设备占了不小的比重。此时再看2019年12月的最新数据,小度语音助手的交互次数已经超过50亿次,比去年同期增长了3倍多。

  值得一提的是,百度特意在财报中单独公布了以小度智能音箱为主的第一方交互数据,或许可以从中读出这样两个信号:

  其一,小度智能音箱的市场销量在公司层已经得到了的认可;

  其二,智能音箱背后的语音交互或将上升到了公司整体战略。

  对于第一个命题,诸如IDC、Canalys等市场研究机构已经在季度销量报告中给出了答案。第二个命题似乎也不是什么新鲜话题,几年前就出现了对语音交互价值的讨论,但这一次似乎又有所不同。在“智能音箱大战”的洪荒之力下,智能音箱正在以千万级的季度出货量走进一线城市到偏远乡镇的家庭,“语音交互”不再是什么陌生词汇。

  也就是说,几年前讨论语音交互还属于雾里看花,所有的观点都建立在某种假想上,今天却早已是一个现实的商业话题。

  语音交互的远景和近况

  关乎语音交互的想象似乎从未停止,科幻电影《Her》中对语音交互的设定,大抵就是多数人认可的远景:

  1、语音助手可以个性化定制,选择自己喜欢的声音和性格;

  2、在数据处理上几乎是万能的,可以得到任何想要的结果;

  3、语音助手有自己的情感和思维方式,并可以被赋予形体。

  在这样的设定中,人工智能脱去了科技冰冷的面纱,有着人性化和活色生香的情绪,甚至可以让人机对话变成情人间的絮语。和许多黑科技的诞生一样,有了美好远景的语音交互成了几代“程序员”的奋斗方向。

  特别是深度学习技术在2010年引入到语音识别领域后,苹果Siri、Google Now、百度语音、微软Cortana等“语音助手”类产品应运而生,有问有答的人机对话逐渐成为现实,哪怕机器还处于被动接受人类输入大量数据阶段,不能深层次理解人的意思。

  智能音箱时代的语音开始进入到自然交互阶段,不仅有问有答,人工智能还可以根据上下文逻辑和环境信息,作出个性化的决策或推荐。特别是百度等已经在智能音箱中加入了多轮连续对话能力,人们和智能音箱的对话正越来越自然。

  可即便如此,现阶段的语音交互和《Her》中的“萨曼莎”,还有着286电脑和iPhone一样的差距。但站在商业的视角上,看到的却是乐观的商业前景,而非感叹技术上存在的鸿沟,原因同样有二:

  一是现阶段的语音交互业已成为主流的人机交互方式,语音识别的正确率在97%以上,可以满足大多数场景下的信息输入,无异于十年前的触摸屏。

  二是语音交互用户体验的优劣建立在已有的用户数据上,很少有人会对智能手机产生依恋,对语音交互可能有不一样的情感,商业基础无疑更加稳健。

  那么,当语音交互渐渐流行的时候,势必会在商业上产生颠覆性的变化。

  下一个BAT的“通关密码”

  事实似乎也是如此,互联网的每一次繁荣都与人机交互方式的迭代不无关系。

  比如PC时代的商业格局,几乎是浏览器和搜索引擎主导的。

  彼时用户连接互联网的行为被局限在键盘和鼠标上,稍微极客一些的用户可以通过浏览器输入网址连接信息,大多数用户是在搜索框中输入关键词,然后点击鼠标或回车键了解世界。在这样的人机交互方式和用户习惯下,信息的整合与输出是“中心化”的,谁能掌握浏览器和搜索入口,谁就拥有信息分发的话语权。

  智能手机的出现在某种程度上淘汰了鼠标,进一步催生了APP的产品形态,直接导致搜索和浏览器的中心地位被削弱。

  与之对应的商业格局也迅速分化。早期的焦点是围绕“应用中心”的争夺,谁拿到了APP的分发入口,谁就能抢到最大的一块蛋糕,以至于左右一些APP的存亡。后期进入到超级APP林立的时代,也就是我们现在熟悉的场景,微信、淘宝、百度、抖音等APP占据了大量的用户时间,“时间”取代“入口”成为互联网体系的“硬通货”。

  沿循这样的逻辑,语音交互的流行可能让信息的分发方式重新拐向中心化,商业格局也将走向新的转折点。