本专场将重点探讨以Apache Flink、Spark为代表的大数据框架,以及大... 展开 >
杨军在阿里巴巴计算平台PAI团队担任资深算法专家,目前主要负责模型系统联合优化相关工作,他的优化关注点涉及到集群层面的硬件资源效率以及作业本身的执行性能。他对于结合AI模型作业特点分析,从模型系统联合视角进行co-design优化的技术方向有着比较浓厚的兴趣。
杨军在阿里巴巴计算平台PAI团队担任资深算法专家,目前主要负责模型系统联合优化相关工作,他的优化关注点涉及到集群层面的硬件资源效率以及作业本身的执行性能。他对于结合AI模型作业特点分析,从模型系统联合视角进行co-design优化的技术方向有着比较浓厚的兴趣。
本专场将重点探讨以Apache Flink、Spark为代表的大数据框架,以及大家关注较多的机器学习云平台等,邀请知名企业技术专家分享当下开源大数据技术的发展趋势以及与人工智能之间的糅合与平衡,并展示一线生产场景的优秀实践。
本演讲会分享PAI团队在深度学习编译优化技术方向的探索和实践经验,包括优化的整体方法论,具体的设计细节及权衡取舍,工程研发管理、性能评测结果以及具体的业务落地case展示。并会结合业界编译优化的技术进展来呈现我们对该领域技术演化的一些思考和认识。
听众收益:
1.能够对深度学习编译优化技术方向建立起相对系统完整的普及性认识;
2.能够了解到一项底层技术从研发到具体落地过程中的经历脉络;
前言亮点:
1.结合我们所看到的业务特点抽象出来的深度学习编译技术方案具备一定的领域差异化;
2.在我们的方案里,将深度学习编译优化问题本质上抽象成一个Design-Space Exploration的问题,而经典DSE作为NP-hard问题,往往面临组合爆炸的挑战,我们针对这个挑战,提出了具备一定技术特色的解决方案,并在实际业务里进行了落地验证。
听懂我的演讲,需要具备这些知识储备:
1.对深度学习建模知识有基本的认识,能够知道什么是CNN、RNN、Attention,对模型原理有一定的认识;
2.对深度学习引擎有一定的普及性认识;
3.最好对于异构计算,比如GPU优化,有普及性质的了解。
人工智能经过数十年的发展,已经在计算广告、推荐系统、金融应用、医疗、能源、教育、计算机视觉、自然语言处理、生物信息学等诸多领域取得了成功。如今,越来越多的行业希望通过人工智能技术,实现更智能更高效的业务增长。然而,现阶段的人工智能技术实际落地需要跨越人才、数据、算法、工具、计算资源、规模化应用等诸多门槛,因此构建有效的低门槛AI全栈平台是人工智能技术广泛落地的核心关键之一。第四范式在过去5年中一直致力于构建低门槛的AI全栈平台,本次分享将会从算法研究、架构设计、产品及生态设计等多个方面分享第四范式在构建低门槛AI全栈平台方面探索的经验。
演讲提纲:
1. 分享自动机器学习、弱监督学习、保护隐私的机器学习、图学习等前沿技术研究方向的进展
2. 解析第四范式低门槛AI全栈平台的技术核心——AutoML方案
3. 分享第四范式自研的高效交互式自动机器学习框架在用户接口设计、面向自动机器学习的特征处理、模型训练以及非梯度优化引擎设计的思考和经验,分享在底层调度、通讯优化等多个方面设计上的思考和经验
4. 分享在金融、医疗、能源、媒体等多个领域取得领先效果的成功案例
听众收益:
1. 了解人工智能在实际落地中的挑战与解决办法
2. 了解第四范式构建低门槛的人工智能平台时,在算法研究、架构设计、产品设计等多个方面的探索经验
3. 第四范式在互联网、金融、能源、医疗、教育、媒体等多个领域的实际落地经验
本次讲座将从数据科学通用API及计算引擎两个维度介绍Databricks在构建统一数据分析平台上的新一轮实践。讲座以统一数据分析的基本思路作为切入点,从Databricks Koalas和Delta两个系统的设计初衷到实现细节逐步展开,相信其中的设计和实践经验会对大家有所帮助。
演讲提纲:
一、分享Databricks在构建统一数据分析平台及产品的基本思路
二、Databricks实践经验解析
1. 数据工程与数据科学的统一:Koalas的设计初衷及实现细节解析
2. 流式与批量计算的统一:Delta架构及基本原理
三、统一计算引擎——Apache Spark 3.0亮点一览
听众收益:
1. 了解大数据统一分析平台研发中的常见痛点和可行解决方案
2. Databricks在构建统一数据分析平台、产品上实践经验