小爱:语音识别和NLP在语音交互中的实践

所属专题:分论坛一

嘉宾 : 王刚 | 小米小爱总监

会议室 : 第二会议厅C

讲师介绍

演讲嘉宾:王刚

小米 小爱总监

王刚,博士毕业于香港科技大学计算机科学系,现任小米小爱语音交互系统的负责人,为小米各类智能设备提供语音交互的技术和产品。目前小爱已覆盖了小米AI音箱、小米人工智能电视、小米手机以及小米生态链中多种类型智能硬件。在加入小米之前,王刚博士在微软亚洲研究院和腾讯工作,长期从事机器学习和搜索引擎方向的研发工作。

议题介绍

地点:第二会议厅C
所属专题:分论坛一

演讲: 小爱:语音识别和NLP在语音交互中的实践

本次讲演将讲述小爱从0到1的研发经历,介绍在小爱开发过程中所遇到的一些典型问题,以及在解决问题过程中的一些思考过程和相应的解决方法。使用语音的人机交互面临着一系列的技术挑战,而小爱只是走了万里长征的第一步,听众将从本次讲演中对语音交互系统的特点有一个全面的了解,对在语音交互中出现的新问题和新挑战有更深刻的认识,了解小爱在解决问题过程中的思路和方法。

内容概要

1. 背景

1.1. 发布人工智能电视,有屏幕设备的用户特点(17-03)
1.2. 发布水滴平台(17-05)
1.3. 发布小爱音箱,无屏幕设备的用户特点(17-07)
1.4. 发布手机上的新语音助手,触摸屏幕的用户特点(17-11)

2. 语音交互和搜索的重要区别

2.1. 只有一次机会的交互方式
2.2. 用户行为反馈
2.3. 多轮对话
2.4. 自然语言的表达:随意、模糊

3. 语音识别

3.1. 不同引擎在不同场景表现的差异
3.2. 每一家都不同的优势:方言、响应速度
3.3. 多家融合策略

4. 垂域建设

4.1. 电视垂域
    4.1.1. 背景:query的表达
​    4.1.2. Slot种类介绍
​    4.1.3. Word Lattice方法
​    4.1.4. 案例分析

4.2. 音乐垂域
​    4.2.1. 背景:query
​    4.2.2. 各种歌曲
​    4.2.3. 基于搜索的方法
​    4.2.4. 案例分析

4.3. 其他典型垂域
​    4.3.1. 计算器
​    4.3.2. 翻译
​    4.3.3. 控制类
​    4.3.4. 知识问答
​    4.3.5. 闲聊

5. 中控策略架构及实战案例

6. 多轮交互

6.1. 失败概率的累计
6.2. 实战案例:智能家居控制

7. 用户行为反馈

7.1. 纯语音交互的隐反馈
7.2. 完听率
7.3. 重复query

8. 总结