
近年来,全球人工智能发展进入新阶段,智能感知、认知等技术对经济发展和社会进步产生重大而深远的影响。2020年3月4日,中共中央政治局常务委员会召开会议提出,要加强新一代信息基础设施建设,人工智能成为新基建七大板块中的重要一项。目前,智能语音作为人工智能技术的重要组成部分,以语音交互为核心的产品服务层出不穷,结合不同行业领域挖掘智能语音在新基建的巨大价值,成为探索智能语音创新成果应用转化的新路径和方法。为更好地赋能传统产业基础建设升级,AI语音正在展现出以数据驱动、人机协同、跨界融合、共创分享的 全栈式 发展模式。
人工智能第三次浪潮推动语音经济蓬勃发展
受益于深度学习算法进步、国内外政策支持和全球主要经济体的高度重视,人工智能第三次浪潮正在驱动智能语音技术产业快速发展。语音识别、语音合成等智能语音核心技术已实现语音智能化感知分析,成为机器的 耳朵 和 嘴巴 ,语音交互使得人与机器的沟通交流变得更加自然顺畅,并将为下一代软件设备创造出巨大价值,逐步形成以创新为驱动的 语音经济 。
语音经济 以交互服务为核心,以自然语音交互摆脱了传统屏幕交互模式,通过技术与场景应用的持续融合,不断赋能产品服务的智能化发展,智能车载、智能机器人、智能音箱、智能客服等诸多细分领域下的产品大量涌现。美国投资机构Mangrove Capital Partners发布的《2019年语音技术报告》预测,2025年 语音经济 的规模将达到1万亿美元。 语音经济 的蓬勃发展,为智能语音技术创新和产业融合应用提供了良好的环境和条件,将进一步推进智能化新型基础设施建设的加速落地。
平台、终端、场景融合赋能AI产业应用
智能语音技术在实际的产品应用转化过程中,离不开与软件、硬件和行业的融合,通过 相互渗透、兼容并发 的转化方式逐步赋能平台、终端和场景,可形成 智能语音﹢ 的新型基础设施发展新业态。
智能语音﹢软件服务 ,形成平台应用新产业。在C端,语音助手已经成为人机交互的主要入口,以更加拟人化、智能化的交互方式成为人们生活、工作的新帮手。在B端,智能语音应用以智能客服为代表,除了代替部分人工客服外,可延伸至社会服务、智能营销、智能推荐等重要外部场景。此次抗疫期间,为了提升防疫部门在疫情调研、电话通知、人员筛查等环节的工作效率,多家人工智能企业推出智能外呼机器人,通过智能语音电话呼叫回访,精准高效地完成人员身体情况调查和活动轨迹记录等信息收集,目前大部分企业呼叫总数已达到百万级,日均呼叫量超过万级。
智能语音﹢硬件设备 ,扩展终端应用新模式。智能语音技术以其 无屏化 的交互优势,衍生出了众多新型智能化设备,如智能音箱、可穿戴设备、智能服务机器人和智能翻译机等。中国信息通信研究院公布的《全球人工智能产业数据报告》显示,2019年第二季度全球智能可穿戴设备总出货量为6770万台,同比增长85.2%。随着物联网的逐步普及和应用发展,鉴于智能语音为各类硬件设备提供了更高效的信息沟通渠道,硬件设备还将衍生出各类终端应用新模式。
智能语音﹢垂直行业 ,衍生出新业态。目前,智能语音在家居、医疗、交通和教育等传统行业中已经充分发挥赋能升级作用,如语音可控制家居和车载环境中空调、音箱等设备,电子病历和临床报告语音录入与转写,语音技术应用于口语训练考试、互动教学以及儿童早教智能硬件等产品。国内北京协和等多家医院已推出智能语音录入系统,调研数据显示,90%的医生认为语音录入系统帮助提高了工作效率,超过50%的医生认为每天可节约1小时左右的时间。Statista的预测数据显示,2022年国内智能家居市场规模将达到1627亿元人民币,渗透率将会升至21.2%。可见,通过对垂直领域下场景业务需求的深入分析,智能语音技术还将在传统产业中发掘出更多新的消费增长点,推动传统产业的智能化和个性化发展。
全栈式软硬件协同迎合 云 端 物联网时代
随着5G万物互联时代的到来,设备应用端侧作为数据的生成端和使用端,成为人工智能基础建设重要的应用落脚点,但同时也对端侧实时服务能力提出更高的要求。
端侧的应用通常要实现 云 端 的数据处理传输,信息网络通道、芯片存储计算以及算法数据处理等都直接关系到端侧设备的服务能力。因此,通过硬件采集传输、端侧软件架构、数据中心协同等方法,实现算法、芯片、网络等关键要素的合理优化配置,搭建个性化多维度、多层次的软硬件协同方案,成为全面推进端侧发展的充分条件。目前,大批传统芯片厂商和语音处理服务技术公司开始聚焦专用语音芯片产业,基于具体场景的特殊化需求,推出全栈式软硬件一体化解决方案,打造语音交互的专用SoC芯片,不仅满足端侧硬件运算力和功耗的需求,还提高了端侧语音数据的处理效率,用新思路、新方法赋能物联网端侧的服务性能。
搭建智能语音平台生态提升新基建行业协同能力
2017年11月,科技部公布国家新一代人工智能开放创新平台,明确 智能语音创新平台 为AI 开放平台建设任务之一,积极倡导推进面向AI应用领域的普惠生态建设。与此同时,我国智能语音相关企业立足于自身优势积极探索新的发展方向,不断通过产业协同的方式搭建智能语音生态。国内互联网公司近几年在智能语音方面发展迅速,通过开放语音生态系统,以产业内合作的方式,将语音技术植入产品或应用于相关业务场景,如百度、腾讯、阿里等互联网巨头均已推出语音开放平台,向开发者提供了大量API接口,以提升开发者在平台中的活跃度;国内智能语音公司,从单一智能语音技术商转型为全方位人工智能技术服务商,如科大讯飞、思必驰等企业依托原有技术优势,以垂直领域和细分场景为突破口,已重点布局家居、车载和智能终端等领域。
在智能语音生态逐步完善的过程中,新基建的提出为构建生态圈提供了新的要求和方向。首先,智能语音产业链协同生态,需从上游基础技术层、中游基础应用层到下游方案产品集成层,打通技术、数据和场景的信息交流互通壁垒,从而实现产业链条生态供应的流通性。其次,产学研资源协同生态,需通过优势互补和开放共享,充分将核心技术研究和产业应用需求结合,扩展以AI新基建为主要内容的语音生态资源建设。最后,行业领域协同生态,需针对行业痛点,充分了解垂直领域的实际需求和特点,将智能语音通用平台与教育、医疗、交通等行业服务能力相结合,搭建智能语音技术与行业应用创新转化的协同生态。
总而言之,智能语音作为人机交互的主要入口,正在逐步融入人们的日常生活,充分赋能各行各业,成为AI新基建中必不可少的一部分。未来,AI语音将朝着 全栈式 发展的方向,继续提升软硬件一体化和产业平台生态协同能力,通过多模式融合方式促进产业应用发展,让人们体验到更多AI语音带来的美好感觉。
(作者:中国信息通信研究院云计算与大数据研究所 李荪)
(原标题:人工智能助力新基建 AI语音开启 全栈式 发展模式)

