随着语音识别、语音合成、NLP等核心技术的逐渐成熟,智能语音交互的应用场景越来越... 展开 >
刘嗣平,曾任酷狗音乐移动事业部总经理&总裁助理、苏宁云商高级研发总监。曾带领手机酷狗APP团队,跻身国内APP用户量的Top10。在人工智能、互联网金融等方面有丰富的实践经验和资源。
九四智能组建于2018年3月,是一家专业从事语音合成、语音识别、智能对话等技术研发,专注于为企业客户提供基于智能语音交互的深度RPA应用。
刘嗣平,曾任酷狗音乐移动事业部总经理&总裁助理、苏宁云商高级研发总监。曾带领手机酷狗APP团队,跻身国内APP用户量的Top10。在人工智能、互联网金融等方面有丰富的实践经验和资源。
九四智能组建于2018年3月,是一家专业从事语音合成、语音识别、智能对话等技术研发,专注于为企业客户提供基于智能语音交互的深度RPA应用。
随着语音识别、语音合成、NLP等核心技术的逐渐成熟,智能语音交互的应用场景越来越多。本专场将分享来自一线智能语音交互产品缔造者的经验,探讨核心技术的发展趋势和落地案例。
达摩院语音实验室自研的KAN-TTS(Knowledge-Aware Neural TTS)深度融合了目前主流的端到端TTS技术和传统TTS技术,基于不同领域的深层Knowledge,针对CPU部署的框架设计和效率优化,包含20多项关键算法改进。相对于传统TTS技术而言,基于KAN-TTS技术的合成语音可以显著的提高合成语音整体的表现力。以核心技术为基础,阿里为各行各业的企业/组织打造了开箱即用的TTS和TTS定制能力,目前已经提供覆盖 5 大场景的 41个高品质的开箱即用声音,还提供低成本快速高品质定制服务,已经为多个合作伙伴定制了TTS声音。
演讲提纲:
1. 语音合成技术概述
1.1 语音合成技术的发展历史
1.2 语音合成技术的实际需求
2. KAN-TTS技术介绍
2.1 KAN-TTS技术
2.2 基于KAN-TTS的定制
3. KAN-TTS实践
3.1 开箱即用的TTS
3.2 TTS定制实践
听众收益:
1. 了解TTS行业技术的进展以及最新的应用场景
2. 了解阿里为从业人员提供的开箱即用TTS服务和TTS定制服务
智能交互机器人在客服领域、智能音响、车载系统等领域已经被广泛使用,但是目前交互机器人给用户的感觉就是一个冷冰冰的机器人,不太形象化、人性化,用户很容易觉察到对方是一个机器人。本次分享也将从交互机器人的现状开始,拓展出一些在实际场景中目前交互机器人在应用上面存在的一些局限性,之后再会介绍追一科技在新一代交互机器人上的探索工作。目前追一科技的探索工作主要包括多模态情感分析及意图识别、连续学习、对抗学习、少样本学习、文本生成及风格迁移、多模态交互等方面,从而达到提高交互机器人可复制性、拟人化、智能化程度。给听众带来一些思考,共同去提高交互机器人的智能化与人性化程度。
演讲提纲:
1. 目前交互机器人的主要介绍
(1)什么是交互机器人
(2)交互机器人的划分
2. 交互机器人落地过程中的瓶颈
(1)冷启动、可复制能力不够
(2)口语化表达理解能力不够
(3)不能洞察用户情感,从而进行安抚
(4)回答单一,不够拟人化
3. 追一科技的探索工作
(1)连续学习、少样本学习,提升模型理解能力
(2)语音语义联合建模,提升口语化理解能力
(3)多模态情感分析,结合文本生成
(4)文本风格迁移,做到拟人化
(5)对抗学习,提升系统鲁棒性
4. 畅想对话机器人的未来
(1)更智能的语义理解
(2)更拟人化,自由的问答
(3)多模态交互
听众收益:
1. 了解现有交互机器人的前沿进展与现状
2. 了解交互机器人实际使用中的用户体验与挑战
3. 了解追一科技在应对挑战的方法与思考
4. 了解提高交互机器人体验的方式以及如何融入其他新技术
微软小冰是领先的跨平台人工智能机器人,本次讲座将介绍微软小冰最新的对话技术框架,以及在这套框架的基础之上,如何一步步构建人格化的对话机器人,并且结合语音场景,如音箱、车载、手机助理等,阐述我们是如何全面使用全双工技术,及它所带来的新的挑战,和我们是如何应对的。
提纲:
1. 对话系统概述
检索模型、生成模型
共感模型
2. 对话系统最新进展
可控对话,小样本学习
预训练技术在对话系统中的运用
3. 如何构建人格化机器人
基础人设
不同风格的对话
拟人化的声音
如何让机器人有自己的观点
4. 落地:基于全双工的语音交互
优势以及难点
解决思路
未来发展方向
听众收益:
微软小冰是领先的跨平台人工智能机器人,本次讲座将介绍微软小冰最新的对话技术框架,以及在这套框架的基础之上,如何一步步构建人格化的对话机器人,并且结合语音场景,如音箱、车载、手机助理等,阐述我们是如何全面使用全双工技术,及它所带来的新的挑战,和我们是如何应对的。
提纲:
1. 对话系统概述
检索模型、生成模型
共感模型
2. 对话系统最新进展
可控对话,小样本学习
预训练技术在对话系统中的运用
3. 如何构建人格化机器人
基础人设
不同风格的对话
拟人化的声音
如何让机器人有自己的观点
4. 落地:基于全双工的语音交互
优势以及难点
解决思路
未来发展方向
听众收益: