2019语音技术报告:语音经济规模将超过移动应用。

近日,美国投资机构红树资本(Mangrove Capital Partners)本周发布了2019《语音技术报告》。这份名为《语音:欢迎下一代颠覆者》的报告分析了语音助手服务的日益普及,并对2020年Siri的趋势做出了有趣的预测。

以下是腾讯科技整理的报告全文:

在多年的键盘输入和点击手机屏幕之后,我们正在回归最初的“用户界面”:语音。尽管我们尚未感受到语音技术的全部影响,但它正在改变我们与数字世界互动的方式。

重要的是,这一变化影响的远不止是查看天气预报、获取音乐和设置闹钟。语音带来了平台和用户界面的变革,堪比网页和智能手机。作为人工智能和机器学习的入口,语音技术将以强大的新方式为我们提供服务。

在Mangorve,我们相信在未来10年,发音将成为决定性的主题之一。除了用数字服务影响各行各业,语音技术还将培养新一代的科技公司。语音技术将与人工智能一起,从根本上改变人机关系,为下一代软件创造巨大价值。

自2011苹果推出Siri以来,语音技术有了长足的进步。随着机器学习的发展,我们在语音识别(语音转文本)和自然语言处理(识别文本中的指令)方面取得了长足的进步。事实上,语音系统的单词识别准确率已经超过了95%,也就是说它们已经具备了类似于人类的语言理解能力。与打字相比,语音产品提供了一种更加自然、便捷、高效的交流方式。所以语音注定会成为最重要的人机交互界面。

根据Juniper Research的数据,目前市场上有25亿个语音助手。随着科技巨头竞相加入竞争,越来越多的家庭正在启用语音服务。在美国,2018年家庭智能音箱的总数量增长了78%,从6670万增加到65438+8550万。亚马逊在该市场的份额达到了64.6%。科纳仕公司预测,到2023年,全球智能音箱的装机容量将增加到5亿。

语音也正在成为智能家居和物联网的入口。亚马逊宣布,4500个品牌已经提供了28000个支持Alexa的智能家居设备,包括电视、炊具和机器人吸尘器。除了进入家庭场景,语音助手也正在进入万豪和其他酒店的房间,在车载信息娱乐系统中也非常流行。亚马逊正在与多家汽车公司谈判。据悉,亚马逊车载产品Echo Auto的预售订单已经超过1万。Echo Auto提供全方位的免提体验,包括打电话、导航和控制智能家居设备。

语音技术也在超越语言障碍。目前谷歌的服务已经支持30种语言,甚至可以同时听懂用户说的多种语言。有趣的是,语音服务在中国的普及速度更快,阿里巴巴在中国智能音箱市场处于领先地位。

各种热门应用的出现,让人联想到App Store的早期发展。亚马逊Alexa提供的功能包括对新妈妈的母乳喂养支持,鼓励孩子刷牙,帮助用户锻炼,指导足球队,指导人们如何祈祷。

由于亚马逊Alexa与世界上最大的电子商务平台之一直接相关,语音购物也在发展。亚马逊看到,2018的节日季,Alexa平台的电商交易额同比增长了两倍。沃尔玛最近推出了基于谷歌语音助手的在线生鲜购物服务,购物者可以通过谷歌主页、智能手机或智能手表将产品添加到购物车中。

根据Juniper的数据,在美国和英国,语音电子商务的规模将从2018年的20亿美元增长到2022年的400亿美元。有意思的是,语音电商最受欢迎的三大商品类别都是低价商品:生鲜杂货(20%)、娱乐(19%)和电子产品(17%)。

因此,零售商获得“亚马逊精选”的地位将更加重要。根据oc & amp;根据C Strategy Consulting的数据,85%的亚马逊购物者最终会选择亚马逊推荐的产品。不过,目前还不清楚具体产品如何获得这样的推荐。

无论是线上还是线下,语音技术一直在引导消费者购物。针对基于语音体验制作鸡尾酒、品尝威士忌等场景,快消品厂商正在探索如何提高产品定位和用户忠诚度。

重要的是,语音服务正在从交易型向对话型转变。这种趋势的最终结果很难完全理解,但你可以这样考虑:你永远不会再感到孤独,无论你是在和Alexa说话,还是和另一个人或人工智能说话。第一波人工智能使用算法来建立推荐引擎,并为谷歌、亚马逊和脸书等互联网服务提供快捷方式。第二波是帮助企业使用结构化数据来优化决策过程。像Palantir这样的公司开始崛起。他们挖掘大量结构化数据,找出人眼和大脑难以发现的信息关联性。

第三次人工智能浪潮即将到来。人工智能获得了眼睛、耳朵和无数其他感官,从而可以收集从未见过的新数据,然后利用这些数据推动更复杂的过程自动化。与此同时,我们也在从基于命令的静态过程向动态过程转变。这是计算领域的一次结构性变革,将彻底改变我们体验软件和与之互动的方式,模糊数字世界和现实世界的联系。

随着人工智能系统在对话中变得更加熟练,并收集更多关于人和他们周围世界的数据,它们将能够理解情境信息。人类通常可以很容易地掌握这些相关信息,并将其应用到对话中。情境信息将帮助人类和机器以更自然的方式互动和合作。随着体验的优化,变得更加有用,他们会更频繁地交互,机器会获得更多的知识。

这种良性循环意味着,在未来的三到五年内,计算机的对话能力将变得更加复杂,更加具有革命性。我们可以轻松地与无处不在的人工智能对话,而不是把时间花在键盘上打字和智能手机上。重要的是,我们与软件交互的方式将被永远改变:形式将会消亡,接触点将成为“聆听点”。

这可以解释为什么世界上最大的科技公司在语音技术上投入巨资。语音技术带来了平台和用户界面的变化,这与以前的网页和智能手机不相上下,但唯一不同的是,用户不需要任何培训就可以转移到语音。对于这个未来的主导平台,大型科技公司输不起。因此,亚马逊有超过65,438+0,000名员工从事Alexa项目,亚马逊也是语音技术创业公司最热情的投资者之一。

语音技术的影响是深远的,每个公司都需要重新考虑如何与用户互动。这不仅仅是调整SEO(搜索引擎优化),或者开发自己的Alexa“技能”或者Google的“运营”。

最终,企业需要提供一个环境感知和语音优先的界面。能够建立用户之间认知和情感联系的企业将能够更好地吸引用户,而企业如果只是被动地用预设的脚本回应用户的提问,将处于明显的劣势。严重依赖通知来推动应用程序使用的技术公司可能需要重新审视自己的策略。消费者将不再对那些使用太多通知来打破“声音阈值”(如LinkedIn)的公司有太多耐心。

最受欢迎的移动应用成为今天的主导平台,最吸引用户的语音优先界面将成为明天的主导服务。很难预测理想的界面应该是什么样的,但Airbnb、Monzo和优步的下一代很可能在三到五年内出现。

无屏手机的出现,如Light Phone,向我们展示了未来。这样的手机并不依赖于我们所熟知和喜爱的移动应用。考虑到语音服务的学习曲线很短,可以明显降低用户的使用壁垒,在我们注意到全部潜力后,语音经济将会快速发展是合理的。

在与软件交互的过程中,花费时间最长的场景就是工作。因此,有理由假设我们将在工作场景中看到最明显的变化。虽然我们可能仍然需要与屏幕进行交互,但键盘很可能会变得多余。毕竟普通人用键盘每分钟能输入40个单词,却能说出150个单词。

无处不在的人工智能可以支持我们日常工作中的很多任务和流程,比如回复邮件、整理会议信息、向团队成员发布信息、用数据更新相关系统等。这也可能意味着我们将不再被束缚在办公桌前,不得不长时间静坐。

再者,无处不在的人工智能可以注意到效率最高的员工,并告诉其他人他是如何工作的,从而优化工作产出。一个能够不断识别高绩效者的具体策略,并向网络中的其他人分发最佳绩效建议的人工智能学习周期已经开始出现。这些优化网络不是为了取代人工而设计的,而是依靠人类来学习和优化流程。人类仍将处于循环之中。

通过让人们变得更聪明、更高效,新一代SaaS产品将能够收取更高的订阅费,从而成为更有价值的一代企业软件。

虚拟KOL Lil Miquela

正如我们所看到的,虚拟KOL正在逐渐兴起。比如来自洛杉矶的19岁虚拟KOL Lil Miquela,在Instagram上积累了1.5万粉丝,参与过Calvin Klein等知名时尚品牌的营销活动。

位于旧金山的创意工作室寓言在虚拟角色方面更进了一步。公司的虚拟人物有完整的交互能力,有自己的个性。很快,我们就能创造出人工智能全息同伴,比如《银翼杀手》中的乔伊。华莱士公司制造的乔伊可以是“你想看的一切”。

虚拟角色很可能会改变娱乐和客户服务的形式,同时,他们也可以在为老年人和其他有需要的人提供服务方面发挥关键作用。毕竟,被认为孤独的人健康下降的风险要高59%,社交孤立是抑郁症最常见的原因之一。

总部位于巴塞罗那的Safe365作为一个技术驱动的社区和互助网络,吸引了许多老年人。语音产品提供了一种非常用户友好的方式来监控健康和认知能力,并提供关于锻炼和药物治疗的提醒。

事实上,语音和人工智能最终可能会完全取代医生。K Health开发了一种人工智能,它结合了数千名医生的经验,可以做出准确的诊断。在语音技术的帮助下,人工智能也可以像人类医生一样为患者提供安慰。

根据我们的分析,对语音创业公司的投资正在加速。语音技术创业公司今年已经融资7.86亿美元,远远超过2018年的5865.438亿美元和2017年的2.98亿美元。这样的融资增长显示了市场对语音技术将带来变革的信心。融资规模也在大幅上升。2019年至今平均交易规模为3000万美元,而2018年和2017年分别为18万美元和17.5万美元。

同时,亚马逊Alexa基金自2015成立以来,已经进行了72笔投资。在过去的18个月中,该基金投资的创业公司涉及娱乐、健康、教育、交通、电子商务、酒店和SaaS行业。这说明亚马逊相信语音技术会改变一系列行业。

语音技术领域最大的挑战之一是隐私保护。根据微软的数据,41%的语音助手用户担心信任、隐私和被动监控。发现谷歌的Nest设备中有一个隐藏的麦克风,产生了负面影响,亚马逊的“监控房间内所有对话”专利申请也是如此。

如何回应这些担忧取决于科技公司,苹果在这方面的工作卓有成效。苹果收购Silk Labs值得称赞,它开发了在设备中运行的人工智能软件,而没有使用云计算平台来处理数据。

苹果在围绕语音服务建立生态系统方面进展缓慢。事实上,苹果1987提出的“知识导航工具”对语音服务给出了更清晰的愿景。语音服务社区期待苹果在2020年的世界开发者大会(WWDC)上发布面向开发者社区的Siri操作系统,从而加速创新和普及。

Voicebot.ai的编辑兼发行人布雷特·金塞拉(bret Schmidt)说:“Siri操作系统对于鼓励创新是必要的。许多人认为,苹果需要赶上亚马逊和谷歌语音助手取得的进步。”

《机械纪》等热门电影提出的一个问题是,如果我们痴迷于机器人,爱上代码而不是其他,那么人工智能就会成为对人类的威胁。虽然这种说法在一些人听起来很牵强,但约会模拟游戏已被证明非常受欢迎。在国内,《爱与制作人》游戏首月下载量突破700万。

尽管我们对我们的隐私保护概念提出了挑战,并对人类与技术的关系提出了新的问题,但我们仍然有许多理由对语音技术保持乐观。这项技术将推动新一轮生产力提升,让消费者、企业和社会受益。此外,它还将帮助我们更好地照顾老年人,同时使全球7.74亿文盲可以使用互联网。

键盘的消失:我们不再需要打字,而是可以使用语音和手势。键盘将在未来5到10年内基本消亡。

语音技术将带来新的产品类别,包括无屏智能手机。

品牌将很快需要通过“声音身份”来识别,产品搜索将被彻底改变。

由于用户在使用语音服务时无法关注具体的应用,硬件将再次变得比软件更重要。

虚拟伴侣将成为现实,满足你生活的所有需求。

苹果将在2020年推出Siri操作系统,从而推动语音经济的巨大创新。到2025年,语音经济规模将达到1万亿美元,超过移动应用经济。