嵌入式深度学习框架研发与落地实践

所属专题:AI工具与框架

嘉宾 : 李永会 | 百度多模搜索部资深工程师

会议室 : 二层 203

讲师介绍

专题演讲嘉宾:李永会

百度 多模搜索部资深工程师

百度大搜索客户端架构师,主要研究方向是嵌入式方向超算性能挑战,对于Andreno GPU和Mali GPU以及ARM CPU投入较多精力研究。目前负责图像搜索相关技术工作,主持移动端深度学习框架Paddle-Mobile的研发工作。重点关注嵌入式领域的硬件和体系结构相关研究。工作成果在百度APP和简单搜索APP多个大型线上APP应用。

议题介绍

演讲:嵌入式深度学习框架研发与落地实践

深度学习技术已经在互联网的诸多方向产生影响。该技术近几年在嵌入式领域也得到飞速发展,各种互联网产品都争相在端侧应用深度学习技术,产品对深度学习的引入也将进一步影响用户体验。随着移动设备被广泛使用,在移动互联网产品应用深度学习和神经网络技术已经成为必然趋势。


在移动端应用深度学习技术时往往存在各种各样的问题,由于移动端设备的性能以及包体积、耗电、内存都有很大的局限,这就为深入全面落地相关技术框架带来了很大难度。本次演讲主要从硬件面对的困难讲起,再到落地应用层面的问题解决,以简单搜索App为案例全面讲解从汇编到顶层架构实现。

演讲提纲:
1. 移动端 AI 现状
2. Paddle-Mobile 介绍
3. Paddle-Mobile CPU 性能优化
4. CPU 优化落地简单搜索 APP 场景案例
5. Paddle-Mobile GPU 性能优化
6. GPU 优化落地简单搜索 APP 场景案例
7. FPGA、NPU等协处理器方案
8. Paddle-Mobile 硬件支持架构描述
9. 简单搜索创新体验介绍

听众收益:

1. 从中可以了解到当下移动端AI框架的格局和发展情况
2. Paddle-Mobile做为百度移动端唯一深度学习框架的ARM CPU和Mali\Andreno GPU的性能优化
3. 对体系结构和硬件知识也可以有一定的深入了解

本网站图片存储由七牛云独家支持