2019年计算机视觉更加火爆,从今年的CVPR2019的盛况可窥一斑。投稿数量从... 展开 >
任海兵,2003年清华大学计算机系计算机应用专业博士毕业。先在三星中国技术院工作11年,先后担任计算机视觉和医疗图像算法团队负责人,曾带领团队获得FRGC人脸识别竞争第一名。2014年加入英特尔中国研究院,从事机器人视觉感知研究工作。2018年底,任海兵加入阿里文娱摩酷实验室,从事视频理解算法研究。任海兵在计算机视觉领域有20多年的研究经验,担任CVPR、ICCV、ECCV等国际顶级学术会议审稿人,发表30余篇论文,拥有30多项专利。
任海兵,2003年清华大学计算机系计算机应用专业博士毕业。先在三星中国技术院工作11年,先后担任计算机视觉和医疗图像算法团队负责人,曾带领团队获得FRGC人脸识别竞争第一名。2014年加入英特尔中国研究院,从事机器人视觉感知研究工作。2018年底,任海兵加入阿里文娱摩酷实验室,从事视频理解算法研究。任海兵在计算机视觉领域有20多年的研究经验,担任CVPR、ICCV、ECCV等国际顶级学术会议审稿人,发表30余篇论文,拥有30多项专利。
2019年计算机视觉更加火爆,从今年的CVPR2019的盛况可窥一斑。投稿数量从去年的3359增加到5160,参加人数从6000多人增加到9000多人。CVPR不仅仅是一场高校的学术盛会,也是工业界的一场盛宴。工业界研究人员在论文投稿、评审和参会人数中的比重越来越大。不但Google、Facebook、Microsoft等传统国际CV算法巨头持续有大量论文输出,而且国内商汤、旷视、腾讯、阿里巴巴等高科技公司也有相当多的论文被录用。所有这些背后折射出计算机视觉巨大的商业落地价值和市场规模。据权威机构预测,到2020年中国计算机视觉市场规模达到700多亿元,增长率超过100%。
计算机视觉在工业上的落地也不仅仅限于刷脸支付、智能监控,在我们生活的很多方面都可以发现计算机视觉的应用,包括智慧城市、辅助驾驶、无人售货商店、智能服务型机器人、智能家居、文化娱乐等。敬请关注AICon计算机视觉专题,了解计算机视觉黑科技在工业界的应用。
计算机视觉技术近些年发展迅速,特别是引入深度学习后,成熟的技术方向和可落地场景越来越多。对工程师来说,一个算法项目从建立到实用一般需要经历论文方法调研、数据采集、模型训练、算法优化和实用部署这些流程,而每年数千篇高水平论文的出现为工程师指出了比较明确的技术思路,但论文算法离实用还有比较大的距离,主要体现在效果无法覆盖广泛的场景,且效率很难满足落地要求等。本演讲从小米公司实际案例出发,如新上线的魔法换天功能等,介绍了如何将核心算法落地实际场景,如何在精度和效率上进行调试优化,确保最终的用户体验。算法实用化过程中总会遇到很多困难点,遇到很多不好解决的BadCase,效率上的优化也没有止境,这些都欢迎参会工程师一起探讨。
演讲提纲:
1. 背景介绍
2. 视觉算法落地流程
3. 落地案例分享
3.1 魔法换天
3.2 人脸检测
3.3 智能挑片
4. 难点和展望
听众收益:
1. 成熟团队的算法研发流程
2. 从论文算法到落地一般会遇到哪些难点,如何解决
3. 深度学习算法和网络的一些优化经验
听懂我的演讲,需要具备这些知识储备:
图像处理、卷积神经网络(CNN)、图像分割和物体检测
本次讲座将分享腾讯优图实验室在医疗AI领域近期的研发工作,通过实例项目的详细介绍,展示实验室在医疗影像智能分析领域的探索,包括如何结合前沿人工智能技术,尤其是计算机视觉以及深度学习技术,推动医疗AI的研发及研究成果转化与落地。
一、深度学习技术在眼底筛查场景中的应用
1. 糖尿病视网膜病变的检出
2. 青光眼的临床诊断与多中心数据验证
二、深度学习技术在医疗影像小数据场景中的探索
1. 医疗预训练开源模型 MedicalNet
2. 自监督预训练模型 Rubik’s Cube
听众收益:
1. 了解腾讯优图实验室在医疗AI场景下的研发方向
2.了解医疗AI落地场景的挑战与解决方案
随着深度学习技术的蓬勃发展,计算机视觉技术得到了日益广泛的应用,逐步改变着我们的生活。计算机视觉的基本任务到底有哪些?作为电商平台,京东如何运用计算机视觉技术提升安全、效率和体验?如何将实际场景中的问题和挑战提炼成算法问题进行优化?本次分享从计算机视觉的基本任务出发,介绍计算机视觉技术在京东的实际落地应用与实践,并分享落地过程中的一些挑战和收获。
内容提纲:
1. 计算机视觉技术概览
2. 视觉理解的应用和实践分享
3. 未来展望
随着AI技术近几年的蓬勃发展,计算机视觉技术逐渐拥有了更为广泛的应用。人脸识别、物体检测等技术更是在安防、智慧城市等领域起着至关重要的作用。除了在社会服务领域之外,从直播到视频,从电影到游戏,从3D到AR/VR等沉浸式技术,视觉技术同时也在逐步改变着我们的生活。不直接从事AI开发的人,往往会认为AI的核心只有算法。其实在真正的AI大规模实践中,AI工程起着和算法平分秋色的至关重要的作用。大多数商业公司要想很好的落地AI技术,AI工程能力是必不可少的原子化能力。阿里巴巴达摩院视觉技术作为阿里AI版图的核心之一,承担着从淘宝拍立淘到大文娱优酷,从阿里云智慧城市到云上媒体AI等等核心业务的AI技术支持。本次分享,将专注于分享AI工程技术在计算机视觉领域的挑战和解决方案,以及阿里巴巴在视觉工程上的若干实践经验。
演讲提纲:
一、视觉工程的价值和挑战
1. 除了数据,AI的瓶颈是计算和存储
2. 视觉工程的基础架构制约着视觉应用的大规模发展
二、视觉工程在阿里的应用实践分享
1. 向量检索的挑战和实践
2. 从图片搜索到视频搜索的挑战和实践
3. 多模态图片/视频搜索的挑战和实践
三、未来的展望
1. 视觉工程未来的挑战和机遇
2. 视觉技术和3D/AR/VR等领域的交叉碰撞,未来可期
听众收益:
1. 了解视觉工程的原子能力
2. 了解如何搭建一个视觉工程体系
3. 掌握视觉工程的一些标准解决方案
Deep Learning has made breakthroughs in many areas, especially in Visual Recognition/Understanding, but it has some challenges both in training and deployment. This talk will introduce our cutting-edge research innovations in efficient CNN algorithm design, leading DNN model compression and deploy-time network optimization to enable deep visual inference at the edge. We will also introduce several visual edge AI applications on smart office and wildlife conservation enabled by our research innovations.
深度学习在许多领域尤其是视觉识别/理解方面取得了巨大突破,但它在训练和部署方面都存在一些挑战。本讲座将介绍我们为实现边缘深度学习视觉推断而进行的高效CNN算法设计、领先DNN模型压缩和部署时网络结构优化的前沿研究。我们还将介绍几个通过我们的研究创新实现的在智能笔记本、智能办公室和野生动物保护方面的边缘视觉智能应用。
演讲提纲:
一、视觉智能研究突破和挑战
1. 视觉智能研究进展及深度学习突破
2. 实现边缘深度学习视觉推断的挑战
二、边缘深度学习视觉推断的前沿研究及应用分享
1. 物体检测及识别高效CNN算法设计研究及实际应用
2. DNN模型压缩及网络结构优化研究及技术落地
3. 边缘视觉智能:保护东北虎案例分享
三、结语及未来展望
听众收益:
1. 了解视觉智能进展及挑战
2. 了解实现边缘深度视觉推断的主要途径
3. 熟悉边缘视觉智能应用开发流程