阿里KAN-TTS技术和落地实践

所属专题:智能语音交互

嘉宾 : 雷鸣 | 阿里巴巴达摩院语音实验室资深算法专家

会议室 : 二层 2号会议厅B

讲师介绍

专题演讲嘉宾:雷鸣

阿里巴巴达摩院语音实验室 资深算法专家

雷鸣,达摩院语音实验室资深算法专家,中国科学技术大学博士,在语音领域发表过多篇论文。曾任微软STC语音科学家,负责语音合成核心算法的研发工作。现负责新一代语音合成系统的前端、后端模型算法研究及产品化等工作。

议题介绍

地点:二层 2号会议厅B
所属专题:智能语音交互

演讲:阿里KAN-TTS技术和落地实践

达摩院语音实验室自研的KAN-TTS(Knowledge-Aware Neural TTS)深度融合了目前主流的端到端TTS技术和传统TTS技术,基于不同领域的深层Knowledge,针对CPU部署的框架设计和效率优化,包含20多项关键算法改进。相对于传统TTS技术而言,基于KAN-TTS技术的合成语音可以显著的提高合成语音整体的表现力。以核心技术为基础,阿里为各行各业的企业/组织打造了开箱即用的TTS和TTS定制能力,目前已经提供覆盖 5 大场景的 41个高品质的开箱即用声音,还提供低成本快速高品质定制服务,已经为多个合作伙伴定制了TTS声音。

演讲提纲:

1. 语音合成技术概述
   1.1 语音合成技术的发展历史
   1.2 语音合成技术的实际需求
2. KAN-TTS技术介绍
    2.1 KAN-TTS技术
    2.2 基于KAN-TTS的定制
3. KAN-TTS实践
    3.1 开箱即用的TTS
    3.2 TTS定制实践

听众收益:

1. 了解TTS行业技术的进展以及最新的应用场景
2. 了解阿里为从业人员提供的开箱即用TTS服务和TTS定制服务

交通指南

© 2020 Baidu - GS(2019)5218号 - 甲测资字1100930 - 京ICP证030173号 - Data © 长地万方
本网站图片存储由七牛云独家支持