英特尔首席工程师,现任英特尔数据中心技术销售集团人工智能技术中国首席架构师,专注于为客户在应用人工智能前沿技术过程中为客户的创新提供技术建议与指导,并提供英特尔产品与技术相关的支持。
夏磊先生于2000年加入英特尔,历任网络、PC、服务器、云计算、大数据、物联网等领域的技术和管理岗位,支持了国内信息产业在互联网、数据中心、云计算与物联网技术时代的持续技术创新。
英特尔首席工程师,现任英特尔数据中心技术销售集团人工智能技术中国首席架构师,专注于为客户在应用人工智能前沿技术过程中为客户的创新提供技术建议与指导,并提供英特尔产品与技术相关的支持。
夏磊先生于2000年加入英特尔,历任网络、PC、服务器、云计算、大数据、物联网等领域的技术和管理岗位,支持了国内信息产业在互联网、数据中心、云计算与物联网技术时代的持续技术创新。
本talk将分享如何在IA架构服务器集群上利用基于英特尔优化的Tensorflow、MXNet、PyTorch 开源方案高效地搭建分布式AI模型训练系统,并利用其进行分布式模型训练。
演讲提纲:
1. 构建基于IA架构的容器或虚拟化服务器集群
2. 如何在IA架构服务器优化分布式任务性能
3. 如何利用Horovod构建分布式训练代码
4. 如何优化分布式训练超参数
听众收益:
1. 了解在IA架构服务器集群搭建分布式AI模型训练的原理
2. 掌握在IA架构服务器优化分布式性能的要点
3. 获得基于Horovod分布式方案训练的经验分享
内容亮点:
1. 现代Xeon处理器上的NUMA特性
2. VM、Docker分布式训练环境
3. Horovod分布式训练