出门问问端到端语音合成系统的研究与应用

所属专题:智能语音前沿技术

嘉宾 : 陈云琳 | 出门问问高级语音工程师

会议室 : 和美厅B

讲师介绍

专题演讲嘉宾:陈云琳

出门问问高级语音工程师

陈云琳,研究方向为语音合成,硕士就读期间曾在出门问问语音组实习,参与研发和上线出门问问第一代语音合成系统。毕业后加入微软,主要从事声学模型以及拼接系统的研究与优化。2018 年加入出门问问,研发并推动上线端到端语音合成系统 MeetVoice(Mobvoi End to End TTS Voice),大幅度提升语音合成质量,MeetVoice 目前已广泛应用在出门问问的车载、TicWatch、TicPods、魔音、小问秘书等多项产品和 ToB 业务中。

议题介绍

演讲:出门问问端到端语音合成系统的研究与应用

近些年来,随着深度学习的快速发展,端到端(End-to-End)语音合成得到了广泛的关注和研究。传统的语音合成声学模型训练的流程复杂,包括 label 设计、问题集设计、HMM-GMM 训练以及决策树聚类等一系列流程。而端到端的声学模型直接使用单一的深度神经网络模型进行建模,极大的降低了模型的复杂度。另一方面,基于神经网络的声码器(Vocoder)在性能上也逐渐超越基于信号理论的传统声码器。端到端声学模型和神经网络 Vocoder 虽然能够合成非常高质量的声音,却面临着计算开销大和使用成本高的问题。如何解决这些难题,有效地将这一系列新技术落地,是语音合成从业者当前面临的最大挑战。本报告将介绍出门问问近期在端到端语音合成系统上取得的研发成果以及在语音合成技术产品化和 ToB 行业落地的经验。

内容大纲

1、语音合成概述

  • 出门问问语音合成发展历程
  • 出门问问语音合成技术概要
  • 出门问问语音合成应用产品和 ToB 业务

2、出门问问技术最新进展

  • MeetVoice 端到端系统介绍
  • MeetParameter - 端到端合成框架介绍
  • MeetVocoder - 神经网络 Vocoder 框架介绍
  • MeetVoice 模型改进与实践
  • 小数据量端到端语音合成的挑战与解决方案
  • 端到端系统的最新研究

3、出门问问语音合成行业实践

  • 车载语音助手
  • 电话助手
  • 公众号文章音频播报

4、展望与总结

听众受益

  • 了解并探讨出门问问语音合成技术最新进展及方向;
  • 了解 TTS ToB 的技术难点和技术方案。

前沿亮点

  • 端到端语音合成系统如何落地;
  • 端到端系统如何在全 CPU 上做到工业级别的首帧低延迟。

交通指南

© 2020 Baidu - GS(2019)5218号 - 甲测资字1100930 - 京ICP证030173号 - Data © 长地万方
想要批量报名或更多优惠?
立即联系票务小姐姐 Amy
或致电:+86-15615403186