雷鸣,达摩院语音实验室资深算法专家,中国科学技术大学博士,在语音领域发表过多篇论文。曾任微软STC语音科学家,负责语音合成核心算法的研发工作。现负责新一代语音合成系统的前端、后端模型算法研究及产品化等工作。
雷鸣,达摩院语音实验室资深算法专家,中国科学技术大学博士,在语音领域发表过多篇论文。曾任微软STC语音科学家,负责语音合成核心算法的研发工作。现负责新一代语音合成系统的前端、后端模型算法研究及产品化等工作。
达摩院语音实验室自研的KAN-TTS(Knowledge-Aware Neural TTS)深度融合了目前主流的端到端TTS技术和传统TTS技术,基于不同领域的深层Knowledge,针对CPU部署的框架设计和效率优化,包含20多项关键算法改进。相对于传统TTS技术而言,基于KAN-TTS技术的合成语音可以显著的提高合成语音整体的表现力。以核心技术为基础,阿里为各行各业的企业/组织打造了开箱即用的TTS和TTS定制能力,目前已经提供覆盖 5 大场景的 41个高品质的开箱即用声音,还提供低成本快速高品质定制服务,已经为多个合作伙伴定制了TTS声音。
演讲提纲:
1. 语音合成技术概述
1.1 语音合成技术的发展历史
1.2 语音合成技术的实际需求
2. KAN-TTS技术介绍
2.1 KAN-TTS技术
2.2 基于KAN-TTS的定制
3. KAN-TTS实践
3.1 开箱即用的TTS
3.2 TTS定制实践
听众收益:
1. 了解TTS行业技术的进展以及最新的应用场景
2. 了解阿里为从业人员提供的开箱即用TTS服务和TTS定制服务