Daniel Povey 是著名的语音识别开源工具 Kaldi 的主要开发者和维护者,被称为 Kaldi 之父。Kaldi 集成了多种语音识别模型,包括隐马尔可夫和最新的深度学习神经网络,公认是业界语音识别框架的基石。
从业界影响力来看,Kaldi 被广泛采用作为标准工具,包括学术界的 MIT、CMU、GHU、剑桥,国内的清华、上海交大等等,工业界包括微软、Google、IBM、Facebook 等等,它的推出也极大推进了整个人工智能语音识别领域的发展。Kaldi 已经成为最广泛使用的开源语音识别工具包之一,许多语音识别团队都依靠 Kaldi。这套工具包自 2011 年发布以来,下载量已经超过了两万多次,合著的论文目前也已经被引用一千多次,可以说 Kaldi 撑起了语音识别开源软件的半边天。
1993 年至 2003年,Daniel 在剑桥大学度过了自己的高等教育经历,获得语音识别的博士学位。
2003 年至 2008年,Daniel 在IBM研究院负责计算机语音识别的工作,成为 Research Staff Member 的一员。
2008 年至 2012年, Daniel 在微软研究院参与计算机语音识别方面的工作。
2012年,Daniel 加入约翰霍普金斯大学,担任语言和语音处理中心系主任。
2019年10月,Daniel 正式加入小米公司,担任小米集团语音首席科学家、声音科学家,开发下一代 Kaldi。