AICon_全球人工智能与机器学习技术大会(北京站)2019-InfoQ

by 雷鸣

阿里巴巴达摩院语音实验室

资深算法专家

阿里KAN-TTS技术和落地实践

达摩院语音实验室自研的KAN-TTS（Knowledge-Aware Neural TTS）深度融合了目前主流的端到端TTS技术和传统TTS技术，基于不同领域的深层Knowledge，针对CPU部署的框架设计和效率优化，包含20多项关键算法改进。相对于传统TTS技术而言，基于KAN-TTS技术的合成语音可以显著的提高合成语音整体的表现力。以核心技术为基础，阿里为各行各业的企业/组织打造了开箱即用的TTS和TTS定制能力，目前已经提供覆盖 5 大场景的 41个高品质的开箱即用声音，还提供低成本快速高品质定制服务，已经为多个合作伙伴定制了TTS声音。

演讲提纲：

1. 语音合成技术概述
1.1 语音合成技术的发展历史
1.2 语音合成技术的实际需求
2. KAN-TTS技术介绍
2.1 KAN-TTS技术
2.2 基于KAN-TTS的定制
3. KAN-TTS实践
3.1 开箱即用的TTS
3.2 TTS定制实践

听众收益：

1. 了解TTS行业技术的进展以及最新的应用场景
2. 了解阿里为从业人员提供的开箱即用TTS服务和TTS定制服务

by 徐易楠

追一科技

AI Lab高级算法研究员

企业服务中智能交互机器人的实践与探索

智能交互机器人在客服领域、智能音响、车载系统等领域已经被广泛使用，但是目前交互机器人给用户的感觉就是一个冷冰冰的机器人，不太形象化、人性化，用户很容易觉察到对方是一个机器人。本次分享也将从交互机器人的现状开始，拓展出一些在实际场景中目前交互机器人在应用上面存在的一些局限性，之后再会介绍追一科技在新一代交互机器人上的探索工作。目前追一科技的探索工作主要包括多模态情感分析及意图识别、连续学习、对抗学习、少样本学习、文本生成及风格迁移、多模态交互等方面，从而达到提高交互机器人可复制性、拟人化、智能化程度。给听众带来一些思考，共同去提高交互机器人的智能化与人性化程度。

演讲提纲：

1. 目前交互机器人的主要介绍
（1）什么是交互机器人
（2）交互机器人的划分

2. 交互机器人落地过程中的瓶颈
（1）冷启动、可复制能力不够
（2）口语化表达理解能力不够
（3）不能洞察用户情感，从而进行安抚
（4）回答单一，不够拟人化

3. 追一科技的探索工作
（1）连续学习、少样本学习，提升模型理解能力
（2）语音语义联合建模，提升口语化理解能力
（3）多模态情感分析，结合文本生成
（4）文本风格迁移，做到拟人化
（5）对抗学习，提升系统鲁棒性

4. 畅想对话机器人的未来
（1）更智能的语义理解
（2）更拟人化，自由的问答
（3）多模态交互

听众收益：

1. 了解现有交互机器人的前沿进展与现状
2. 了解交互机器人实际使用中的用户体验与挑战
3. 了解追一科技在应对挑战的方法与思考
4. 了解提高交互机器人体验的方式以及如何融入其他新技术

by 曾敏

微软小冰

对话系统负责人

微软小冰：人格化对话机器人的构建及在语音场景当中的实践（上）

微软小冰是领先的跨平台人工智能机器人，本次讲座将介绍微软小冰最新的对话技术框架，以及在这套框架的基础之上，如何一步步构建人格化的对话机器人，并且结合语音场景，如音箱、车载、手机助理等，阐述我们是如何全面使用全双工技术，及它所带来的新的挑战，和我们是如何应对的。

提纲：

1. 对话系统概述

检索模型、生成模型

共感模型

2. 对话系统最新进展

可控对话，小样本学习

预训练技术在对话系统中的运用

3. 如何构建人格化机器人

基础人设

不同风格的对话

拟人化的声音

如何让机器人有自己的观点

4. 落地：基于全双工的语音交互

优势以及难点

解决思路

未来发展方向

听众收益：

了解对话系统的最新进展
了解如何构建人格化机器人
了解全双工语音交互的具体实现
了解全双工语音交互的优势和难点

by 曾敏

微软小冰

对话系统负责人

微软小冰：人格化对话机器人的构建及在语音场景当中的实践（下）

微软小冰是领先的跨平台人工智能机器人，本次讲座将介绍微软小冰最新的对话技术框架，以及在这套框架的基础之上，如何一步步构建人格化的对话机器人，并且结合语音场景，如音箱、车载、手机助理等，阐述我们是如何全面使用全双工技术，及它所带来的新的挑战，和我们是如何应对的。

提纲：

1. 对话系统概述

检索模型、生成模型

共感模型

2. 对话系统最新进展

可控对话，小样本学习

预训练技术在对话系统中的运用

3. 如何构建人格化机器人

基础人设

不同风格的对话

拟人化的声音

如何让机器人有自己的观点

4. 落地：基于全双工的语音交互

优势以及难点

解决思路

未来发展方向

听众收益：

了解对话系统的最新进展
了解如何构建人格化机器人
了解全双工语音交互的具体实现
了解全双工语音交互的优势和难点

智能语音交互

出品人：刘嗣平

雷鸣

徐易楠

曾敏

曾敏

专题出品人：刘嗣平

九四智能创始人&CEO

专题出品人：刘嗣平

九四智能创始人&CEO

地点：二层 2号会议厅B

专题：智能语音交互

by 雷鸣

阿里巴巴达摩院语音实验室

by 徐易楠

追一科技

by 曾敏

微软小冰

by 曾敏

微软小冰

关注主办方（InfoQ）

联系我们

交通指南

智能语音交互

出品人：刘嗣平

雷鸣

徐易楠

曾敏

曾敏

专题出品人：刘嗣平

九四智能 创始人&CEO

专题出品人：刘嗣平

九四智能 创始人&CEO

地点：二层 2号会议厅B

专题：智能语音交互

by 雷鸣

阿里巴巴达摩院语音实验室

by 徐易楠

追一科技

by 曾敏

微软小冰

by 曾敏

微软小冰

关注主办方（InfoQ）

联系我们

交通指南

九四智能创始人&CEO

九四智能创始人&CEO