搜索推荐与算法

会议室:二层 2号会议厅A
出品人:张俊林

本专题将邀请相关业内专家,分享工业界中如何将机器学习或深度学习技术正确应用在各种... 展开 >

专题出品人:张俊林

新浪微博 机器学习团队AI Lab负责人

张俊林,中国中文信息学会理事,中科院软件所博士。目前担任新浪微博机器学习团队AI Lab负责人。在此之前,张俊林曾经在阿里巴巴任资深技术专家并负责新技术团队,以及在百度和用友担任技术经理及技术总监等职务。他是技术书籍《这就是搜索引擎:核心技术详解》(该书荣获全国第十二届优秀图书奖)、《大数据日知录:架构与算法》的作者。

他本科毕业于天津大学管理学院,之后在中科院软件所直接攻读博士学位,研究方向是信息检索理论与自然语言处理,就学期间曾在ACL2006、COLING2004、IJCNLP2004等国际顶级会议发表多篇学术论文。另外,他在此期间领导设计的搜索系统曾在美国国防部DARPA主持的TREC高精度检索系统评测中取得综合排名第一名的优异成绩。近年来,陆续在Recsys2019以及ICDM2019等国际会议发表多篇深度学习推荐系统相关论文。

专题出品人:张俊林

新浪微博 机器学习团队AI Lab负责人

张俊林,中国中文信息学会理事,中科院软件所博士。目前担任新浪微博机器学习团队AI Lab负责人。在此之前,张俊林曾经在阿里巴巴任资深技术专家并负责新技术团队,以及在百度和用友担任技术经理及技术总监等职务。他是技术书籍《这就是搜索引擎:核心技术详解》(该书荣获全国第十二届优秀图书奖)、《大数据日知录:架构与算法》的作者。

他本科毕业于天津大学管理学院,之后在中科院软件所直接攻读博士学位,研究方向是信息检索理论与自然语言处理,就学期间曾在ACL2006、COLING2004、IJCNLP2004等国际顶级会议发表多篇学术论文。另外,他在此期间领导设计的搜索系统曾在美国国防部DARPA主持的TREC高精度检索系统评测中取得综合排名第一名的优异成绩。近年来,陆续在Recsys2019以及ICDM2019等国际会议发表多篇深度学习推荐系统相关论文。

地点:二层 2号会议厅A

专题:搜索推荐与算法

本专题将邀请相关业内专家,分享工业界中如何将机器学习或深度学习技术正确应用在各种形态的搜索推荐场景中,包括业务痛点是什么,如何正确地进行技术选型,实施时遇到怎样的困难以及如何快速解决这些问题等宝贵实践经验。

by 陈欢

滴滴出行
高级专家算法工程师
滴滴搜索系统的深度学习演进之路

本次讲座将介绍滴滴搜索的技术框架和用深度学习技术升级滴滴搜索引擎的演进过程。我们对搜索引擎的全流程模块都进行了深度学习技术升级,包括查询词改写、检索召回和排序。在这个技术演进的过程中我们突破了许多工程落地的困难,同时我们结合出行场景特性对这些模块进行了效果优化,相信其中的难点突破、创新设计对大家会有帮助。

1. 搜索概述

(1)不同搜索业务的目标和实现差异

(2)滴滴搜索引擎架构

2. 如何用机器学习实现查询词改写

(1)基于HMM模型的查询词改写

(2)基于BiRNN+Attention的查询词改写

(3)改善深度模型在线预测性能的方法

3. 如何用深度学习实现相关性模型

(1)相关性模型的挑战

(2)深度表示学习模型

(3)深度匹配学习模型

(4)结合地理的深度相关性模型(滴滴AAAI paper)

4. 检索召回排序的技术演进

(1)深度语义匹配召回方法与实现

(2)深度排序模型的实现

听众收益:

1. 了解深度学习在搜索领域的应用

2. 了解相关性模型的近几年进展

3. 了解深度学习在工业界落地的挑战和解决方案

听懂我的演讲,需要具备这些知识储备:自然语言处理、深度学习、搜索框架

by 朱小强(怀人)

阿里妈妈
深度学习算法平台负责人
工业级深度学习在阿里广告的实践、创新与最新进展

过去短短的3年多时间,深度学习从图像/语音等领域席卷进入了互联网,迅速掀起了轩然大波,引发了包括广告/推荐/搜索等在内的工业级应用技术的全面革新。深度学习不仅仅是一种技术,更是一种思想和方法论。它引发了涵盖算法建模范式、模型训练框架、在线服务引擎等在内的新一轮全链路技术升级,已经深刻影响并进一步催生了新技术的持续创新。

本次分享,我将以深度学习在阿里广告技术的实践为例,具体阐述在工业级规模应用上我们对算法演化的思考和成果;算法的爆发式创新强烈地驱动了对基础设施的挑战,我也会简单分享我们去年开源的工业级深度学习框架X-DeepLearning(简称XDL),以及在XDL基础上进一步构建的实时流式深度学习系统、面向大规模稀疏深度模型的实时高性能推理引擎协同优化等技术。    

提纲:

1. 以推荐类广告排序模型为例,介绍在工业级稀疏数据场景下,深度学习算法的演化思路

2. 介绍支撑算法迭代的流式系统、架构,以及围绕着工业级模型的生产化进行的算法系统Co-design优化

by 汤斌

美图
高级算法专家
走向深度学习的美图社区推荐:从工具到算法

美图公司目前拥有3亿多月活跃用户,日均处理上亿图片和视频。为了让用户收获更多,2018年,美图正式转型“美和社交”的战略,社交化转型的过程中遇到了不少困难和挑战。

本次分享将介绍美图推荐算法团队如何应用深度学习技术,来克服社交化转型中遇到的各种挑战。首先,内部基于传统机器学习任务开发的工具,通过特征编码方案和特征数据结构的升级以支持深度学习建模。同时通过对Neural Factorization Machine模型的三次改进,适应了业务对模型的需要。另外通过用户行为序列特征建模进一步增强了模型端到端的能力。为了解决模型因复杂度过高导致的在线耗时增加的问题,我们也实现了多塔网络的模型框架。最后,通过多任务模型的几次迭代,解决了推荐场景下多个优化目标的需求。

在过去一年的具体实践中,从模型改进到特征建模再到多目标优化,我们也总结一些经验,相信也能带给大家一些的启发和帮助。

演讲提纲:

1. 美图推荐场景与面临的挑战

2. 支持深度学习的传统机器学习工具的升级

3. 基于NFM模型的几次模型改进

    a) 基于特征空间线性变换的改进

    b) 基于二阶特征加权Pooling的改进

4. 用户行为序列特征建模

    a) 用户行为序列特征建模的几种方法

    b) 基于用户行为加权的序列建模方法

5. 解决在线推理效率的多塔网络

6. 推荐场景下的多任务学习

    a) 基于样本reweight的方法

    b) 多任务模型之Multi-Task NFM

    c) 多模型以及多个多任务模型

7. 未来的工作计划

听众受益:

1.了解推荐场景下,传统机器学习工具向深度学习工具转变的几个优化点与方案

2.了解NFM在推荐排序下的应用,以及存在问题和优化方案

3.了解用户行为序列特征建模在真实推荐场景下的应用方法

4.了解推荐场景下,多任务学习的几种方法以及各自的优缺点

前沿亮点:

1.深度学习的特征编码方案

2.NFM模型的改进

3.行为序列特征建模方法

4.排序模型在线推理加速策略

听众知识储备:

1. 具备基本的机器学习、深度学习模型实践经验

2. 对推荐场景,以及推荐排序有一定的了解

by 江鹏

快手
推荐算法负责人
快手短视频推荐挑战与技术方案

过去两年时间,国内短视频日均使用时长增长了5倍,时长仅次于即时通讯,是移动互联网使用时长增长的最强驱动力。快手作为日均DAU超过2亿的短视频APP,推荐是用户时长以及体验的重要抓手,快手推荐是工业界最大的推荐业务场景之一(以推荐覆盖用户规模、请求量和数据规模评估)。本次分享围绕短视频生态、工业级数据稀疏性、实时性、数据和目标异质性,介绍快手短视频推荐的挑战和技术方案。

1、快手短视频概况、生态以及推荐面临的技术挑战

2、短视频推荐触发设计方案简介

3、短视频多目标排序技术简介

4、短视频内容和用户冷启动技术简介

听众收益:

1、了解亿级DAU规模下短视频推荐需要考虑的因素

2、了解快手短视频推荐的技术难题和技术方案

3、了解短视频推荐技术落地经验

by 王新欣

网易云音乐
搜索算法负责人
AI算法在云音乐搜索中的应用实践

网易云音乐聚集了大量有追求的音乐爱好者,作为第二大的流量入口,云音乐搜索系统每天承载着千万级的用户诉求。

云音乐搜索系统,分为三大体系:Query理解体系,内容体系以及搜索推荐体系(引流体系)。借助AI的强大计算能力,(1)实现了对用户更好地意图理解、深层次的情感分析,让Query带有“生命力”,更加完善了Query理解体系;(2)实现了深度地扩展召回,同时借助深度学习的排序优势,给予用户更友好的资源、Item展示;(3)实现了流量为多业务赋能的目标,同时借助Multi-task Deep learning ,达到了体验、业务目标共同进步的层次。(4)引入体系的完善,为搜索的流量分配带来了更多可能。

本次分享,重点介绍AI算法在云音乐搜索中的应用实践,以及在算法落地过程中的挑战和解决方案。

1、概述

   (1)云音乐搜索内循环(算法体系)与外循环(业务体系)的组合体系的概要

   (2)云音乐搜索体系架构

2、Query理解体系--搜索的基石

   (1)Query理解体系的演进

   (2)深度模型对实体识别、意图识别的完善

   (3)基于Multi-View 深度文本表示的完善

   (4)Graph-embedding 对于深度扩展召回的完善

3、内容体系

   (1)多资源排序、流量分配框架

   (2)BST模型及其改版在多资源排序的应用

   (3)深度排序模型的演进

   (4)基于ESSM的多任务学习为业务赋能、场景体验赋能的应用

4、引流体系

   (1)引流体系概况

   (2)引流的定位以及发展

听众收益:

1、用户搜索Query具有“生命力”,让Query更丰满

2、多资源如何组合展示?

3、搜索如何为业务导流?

前言亮点:

1、Query理解体系,应用了更多前沿的NLP技术,例如:DSSM、Node2Vec、BERT等。
2、根据场景/业务的特点,应用不同的深度复杂模型,例如:联合学习ESSM 、用户行为序列模型BST 等。

by 杨紫陌

爱奇艺
研究员
爱奇艺视频内容的个性化分发与生产

移动场景下用户时间不断碎片化,能够在有限的时间内抓住用户的兴趣,黏住用户,已经成为各个产品的主要竞争力之一。

视频内容的个性化推荐,其目标不仅仅满足用户体验上的需求,还需要能够让更多的小众原创的内容得以分发,让内容的生产者得到更多的曝光和关注,这样才能够让生产者更加积极提供更多高质量的内容,让整个平台的生态变得健康。针对多个维度的需求,流量中控的解决方案,可以让算法和运营编辑商务的诉求更加高效地结合。

除了在已有的内容中探索用户的兴趣,给用户展示新颖、高质量、多样化的内容,我们还需要根据用户的兴趣去定制化生产更多适合用户兴趣的内容。比如以长视频内容的智能裁剪、周边挖掘、个性化推荐语封面图的生成等。

演讲提纲:

一、视频内容推荐

1. 经典的内容推荐

2. 推荐的高效多场景复用-推荐平台的架构分享

3. 实时化演进

4. 深度学习的线上应用(DeepFM、W&D、双塔等模型效果及资源比较)

5. 多目标问题的解决(重点分享MMoE思路)

6. 流量中控解决运营诉求

二、视频分发形式优化

1. 个性化海报图生产及上线效果

2. 个性化推荐语生成

3. 主题聚合推荐

4. 个性化助力用户增长-冷启动问题的优化

演讲亮点:

1. 流量分发效率和运营诉求结合的解决方案,主要涉及实时计算实时调控
2. 智能分发与智能内容生产的协调,主要用到深度学习相关技术

by 杨逍

百度
主任架构师
搜索商业化的技术变革历程

搜索引擎商业化技术的发展驱动力,一方面来自于基础技术领域如深度学习、IR、NLP、算法博弈论等的不断突破及技术革新,通过技术红利来持续提升变现效率。另一方面也受整个商业化的变现模式及市场环境特点的演化影响,在各业务方向上对变现技术不断的提出新的问题与挑战。本次分享,将重点从这两个维度,介绍和Review搜索商业化各个方向的技术变革历程及驱动力来源。


主要提纲:
1. 搜索商业化概述
2. 技术革新驱动的商业化核心技术方向发展Review,如定向、点击率预估、排序机制设计等,包含百度及业界内的进展
3. 商业化市场的变化及搜索变现在不同时期面临的主要挑战
4. 商业模式变化驱动的搜索商业化技术方向变革
5. AiAds:智能化变现系统及趋势

听众收益:

1. 了解搜索商业化各主要技术方向的变革历程
2. 了解搜索商业化的业务问题及市场设计的演变
3. 了解商业化变现系统的技术选型背后的考虑
4. 了解智能化变现系统的建设经验及行业发展趋势

交通指南

© 2019 Baidu - GS(2018)5572号 - 甲测资字1100930 - 京ICP证030173号 - Data © 长地万方
本网站图片存储由七牛云独家支持