这一轮人工智能的蓬勃发展浪潮逐渐进入下半程,越来越多的企业和从业者对人工智能技术... 展开 >
王晓博,阿里巴巴资深算法专家,目前担任阿里文娱摩酷实验室负责人,9年互联网算法策略从业经验。
2010 年博士毕业于北京航空航天大学计算机学院软件与理论专业;先后在百度、搜狗商务搜索部门从事广告算法策略研发工作;2015 年加入阿里巴巴推荐部门,组建猜你喜欢算法团队,短短三年内带领团队将猜你喜欢商品推荐打造为手机淘宝第一大导购场景,成为淘宝平台导购流量分发的核心入口。2018年起负责优酷算法中心,逐渐形成多模态搜索、智能视频推荐、个性化会员营销、高清视频质量、多媒体内容理解、AR/VR六个技术方向,为阿里文娱打造AI平台,助力业务高速增长。
主要研究方向为大规模分布式机器学习算法、计算广告、智能交互推荐系统、多媒体内容理解。
王晓博,阿里巴巴资深算法专家,目前担任阿里文娱摩酷实验室负责人,9年互联网算法策略从业经验。
2010 年博士毕业于北京航空航天大学计算机学院软件与理论专业;先后在百度、搜狗商务搜索部门从事广告算法策略研发工作;2015 年加入阿里巴巴推荐部门,组建猜你喜欢算法团队,短短三年内带领团队将猜你喜欢商品推荐打造为手机淘宝第一大导购场景,成为淘宝平台导购流量分发的核心入口。2018年起负责优酷算法中心,逐渐形成多模态搜索、智能视频推荐、个性化会员营销、高清视频质量、多媒体内容理解、AR/VR六个技术方向,为阿里文娱打造AI平台,助力业务高速增长。
主要研究方向为大规模分布式机器学习算法、计算广告、智能交互推荐系统、多媒体内容理解。
这一轮人工智能的蓬勃发展浪潮逐渐进入下半程,越来越多的企业和从业者对人工智能技术的应用前景开始担忧,而单独以研发AI技术为主的企业,其生存环境将面临着巨大的挑战。如何将AI与各行各业进行深度结合,进而促进消费互联网向产业互联网的转变,是当下互联网巨头及新型AI企业所面临的挑战和机遇。
云计算为产业互联网提供了重要的基础设施,这使得人工智能技术在教育、自动驾驶、医疗、新零售、IoT等产业中得到了广泛应用;5G时代的到来,其通讯速率是4G的十倍,AI不仅能够帮助企业利用好大数据,而且还能够帮助企业产生更多的数据资产。本专场重点关注AI技术在与产业互联网深度结合应用中所面临的问题及解决方案,探讨如何能够在产业互联网兴起的大潮中用AI技术构建出新的生产力,促进各行业的进一步繁荣发展。
随着内容产业的发展,AI算法能力的表现进一步提升。国内外越来越多的互联网公司开始尝试进行自动的内容生产。传统媒体、MCN机构也开始接受通过AI辅助内容创作。 腾讯游戏也有专门的团队进行自动化游戏内容创作的研究和探索工作。这次报告我们也介绍一下团队模型使用和业务落地过程中的经验,期待同样场景的研究人员互相交流。
一 游戏视频分析
1.1 游戏角色跟踪
1.2 游戏高光片段识别
1.3 游戏场景的目标检测
1.4 游戏海报的分割和评价算法
1.5 基于游戏引擎的自动样本生成
1.6 游戏场景坐标还原
1.7 结构化游戏视频分析实践
二 游戏内容素材创作
2.1 战报文本素材生成
2.1.1 基于table2txt
2.1.2 基于GPT2
2.1.3 文档规划器
2.2 游戏解说语音素材合成
2.3 角色动画素材生成
2.3.1 姿态捕捉
2.3.2 引擎渲染
2.4 视频封面图和标题的生成
三 游戏内容生产
3.1 预定义剧本模式创作
3.2 素材多样性问题
3.3 处理关键点分析技术
3.4 成片特效渲染
听众收益:
自然场景的模型很多无法顺利落地游戏场景,我们做了很多CV算法上的改进工作。过程中的技术经验不仅仅可以落地于游戏,也可以推广至自然场景。
1. 收获AI算法在内容创作上合理落地的建议和经验
2. 收获AI算法在游戏场景和自然场景下的选型优化
3. 了解计算机视觉和游戏引擎的结合如何能提升AI算法表现
前沿亮点:
把CV和CG技术无缝结合,通过CV的多任务还原用户游戏操作行为
听懂我的演讲,需要具备这些知识储备:需要有一定的深度学习,CV和NLP基础知识
3D算法在淘宝有广阔的应用前景。以家居行业为例,通过3D技术可以给消费者带来“所见即所得”的效果,从而大大降低消费者实地考察的时间成本和商品不合适需要退换的高昂成本;在设计师领域,通过3D和机器学习结合,给设计师带来强大的自动搭配和自动设计能力,从而大大降低设计师设计作品所消耗的时间,提升设计师的服务能力。本次演讲将主要从以下几个方面进行分享:
内容提纲
1. 家居场景自动设计
(1) 家具自动布局
(2) 小场景自动生成
2. 家居搭配
(1) 基于用户行为的搭配
(2) 基于商品风格的搭配
3. 前沿方向
(1) 高精度3D重建
(2) 材质建模
(3) 多层次布局
听众收益:
1. 了解3D算法和传统的机器学习结合的技术场景
2. 了解一些能达到产品级要求的算法
听懂我的演讲,需要具备这些知识储备:有计算机视觉、计算机图形学、推荐算法的基础
设计智能涵盖的技术范围很广,不同于视觉理解(识别、检测、分割等),主要聚集于视觉生成、编辑、增强加工等后半段的能力;以此技术为基础的产品,既可是产品柔性制造的上游,也可在媒体生成和营销推广上发挥巨大的作用。旺盛多样的需求,和供给效率之间的矛盾,设计智能技术在其中大有可为;阿里巴巴达摩院设计智能团队,在这一块持续投入了很长时间,并有鹿班、AlibabaWood、画蝶等产品上线,本次分享除了介绍设计智能的概况,也展示了一些在具体行业中的一些应用案例。
演讲提纲:
1. 设计智能概述
1.1 视觉理解和视觉生产
1.2 设计智能应用逻辑
2. 数字内容生产
2.1 鹿班的初创,Banner设计
2.2 详情页短视频生成,AlibabaWood
2.3 智能情景广告、无侵入感的广告植入
3. 实体设计制造
3.1 设计生产制造中的痛点
3.2 包装设计
3.3 服装设计
4. 一些关键技术
4.1 抠图分割
4.2 迁移拓展
4.3 照图生图
5. 小结,看未来
听众受益:
1、技术上,基于前半段视觉理解能力,在后半段视觉生成和加工的分析讲解;
2、应用上,基于阿里大规模的数据和应用场景,通过云服务多个行业的实战案例。
作为当前计算密度最大的单芯片,昇腾910芯片依照着华为公司“全栈全场景”的智能战略,仍旧采用了与去年发布的昇腾310一样的达芬奇架构。众所周知,在深度学习领域,从框架到模型,从API到库都是高度定制化的。这一自研架构在带来更强的算力与更好的能效比的同时,在逐步优化使用体验并建立用户生态的过程中,也遇到了不少困难和挑战。
本次分享将尝试回答下面几个问题:
1. 为什么人工智能专用芯片具有强大的算力和能效比?
2. 达芬奇架构的加速原理是什么样子的?
3. 如果想要针对某种特定架构优化我的算法,使其达到性能最优,我可以采取什么策略?
在过去一年逐步完善人工智能芯片解决方案的具体实践中,我们也总结出了一些经验。本次演讲结合理论与实践,以深度学习中最常用的卷积算子优化为例,希望能够为大家在网络优化的道路上带来一些启发和帮助。
演讲提纲:
一、商业价值=数据+算法+算力
二、计算芯片加速理论
GPU
TPU
三、典型智能计算芯片加速原理
计算单元
存储系统
控制单元
指令集设计
四、加速实战:卷积算子
基于矩阵计算单元的矩阵运算
卷积算子参数定义和数据排布方式
输入特征图数据的格式转换
分块矩阵相乘
性能分析
五、总结
深度学习性能提升小秘诀
人工智能芯片的发展趋势
听众收益:
1. 技术上,结合硬件架构的发展趋势,通过对算法加速理论的讲解,帮助算法开发人员理解人工智能算法的加速原理,把握算法和硬件的发展趋势。
2. 业务上,将算法加速理论与硬件架构相结合,逐点解析卷积算子的实现,帮助听众掌握针对特定领域架构芯片的算法优化方法。