搜索推荐与算法

会议室:二层 2号会议厅B
出品人:张俊林

搜索引擎与推荐系统是人工智能最早进行算法产业化的两个重要方向,目前在我们日常生活... 展开 >

专题出品人:张俊林

新浪微博 AI Lab资深算法专家

张俊林,中国中文信息学会理事,目前在新浪微博AI Lab担任资深算法专家。在此之前,张俊林曾经在阿里巴巴任资深技术专家,以及在百度和用友担任技术经理及技术总监等职务。他的研发兴趣集中在:深度学习、搜索技术、推荐系统、自然语言处理等方面,并在以上领域有多年学术界研究经历及工业界实践经验。同时他是技术书籍《这就是搜索引擎:核心技术详解》(该书荣获全国第十二届输出版优秀图书奖)、《大数据日知录:架构与算法》的作者。

他本科毕业于天津大学管理学院,之后在中科院软件所直接攻读博士学位,研究方向是信息检索理论与自然语言处理,就学期间曾在ACL、COLING、IJCNLP等国际顶级会议发表多篇学术论文。另外,他在此期间领导设计的搜索系统曾在美国国防部DARPA主持的TREC高精度检索系统评测中取得综合排名第一名的优异成绩。

地点:二层 2号会议厅B

专题:搜索推荐与算法

搜索引擎与推荐系统是人工智能最早进行算法产业化的两个重要方向,目前在我们日常生活中发挥越来越重要的作用。本专题将邀请相关业内专家,分享工业界中如何将机器学习或深度学习技术正确应用在各种形态的搜索推荐场景中,包括业务痛点是什么,如何正确地进行技术选型,实施时遇到怎样的困难以及如何快速解决这些问题等宝贵实践经验。

by 王浩

阿里巴巴
人工智能实验室资深技术专家
你问我答:从搜索引擎到语音智能助手

PC互联网时代下,传统搜索引擎能够根据网络用户关键字查询需求精准地返回给用户相关的网址URL链接结果,其核心技术包括:爬虫和索引、检索模型、链接分析、查询分析、相关性和排序等。随着移动互联网时代的到来,搜索用户更期待能获得直接唯一想要的知识结果,知识图谱以及基于知识的问答技术逐渐为搜索引擎进一步赋能。深度学习技术引发了人工智能时代的又一次春天,语音交互搜索技术当前正在兴起,用户与搜索引擎的交互形式从传统的关键词转变为口语自然语言,从单轮问答逐渐转为多轮对话,这给传统搜索技术带来挑战和机遇。本次演讲将分享从传统信息检索、到智能问答以及对话技术的在实际产品化落地的最佳实践经验。

 

演讲提纲:

  1.  PC互联网时代下的搜索核心技术
  2.  移动互联网时代下的智能问答系统技术
  3.  人工智能时代下的智能对话系统技术

 

听众收益:

  1.  可以了解谷歌等搜索公司背后的技术难点和解决方案
  2.  可以了解亚马逊Echo、谷歌助手等智能音箱背后的技术难点和解决方案
  3.  相关技术方案可以应用到自身产品研发的落地场景中

by 李春生

苏宁易购
IT总部搜索研发中心技术总监
机器学习在苏宁搜索平台中的实践

搜索引擎作为网站的主要流量入口,搜索的用户体验对整个网站起到至关重要的作用,优化搜索、提升用户体验,首先需要大量的数据,用户行为数据、商品专家数据以及海量的用户输入表达数据。其次需要机器学习算法针对既有的数据进行学习与组织数据,建立合理的模型,用数据去理解用户创建用户画像,同时还需要及时识别各种异常情况,对异常行为数据进行相应的惩处措施,在充分了解用户行为与商品模型的前提下为用户提供更优的搜索体验。

本次分享主要基于多年搜索实践经验,讲述搜索如何利用机器学习在商品排序、用户意图识别、商品异常检测、异常流量检测、架构优化等方面的应用。


议题大纲: 

1. 搜索系统总体介绍
(1)苏宁易购搜索系统范围
(2)苏宁易购搜索系统架构演变
2. 搜索系统面临哪些难题
(1)用户意图的理解
(2)如何智能纠正与扩展用户query
(3)商品乱挂现象影响搜索排序
(4)作弊给搜索带来的影响
3. 如何利用机器学习技术解决搜索难点
(1)基于CRF的中心词识别模型
(2)基于知识图谱的query扩展
(3)基于CNN与Naive Bayes实现图片与文本类别识别
(4)基于常用分类器实现的黑白分类检测作弊行为
4. 问答式内容搜索系统试水
(1)搜索的召回更加丰富性
(2)基于NLP技术对query进行处理
(3)基于知识图谱进行查询推导
(4)问答式搜索适用场景与用户

听众受益点:
适合从事电商类搜索从业的同行,搜索面临的问题很多都是共性问题,各家解决方案不一样,但是目的都是一致的。搜索的道路没有捷径,需要长期的沉淀,数据积累与长期的实践,分享的目的是让大家互相了解同行的解决方案,互相取长补短。共同提升搜索能力,提升用户搜索体验。

by 孙付伟

知乎
推荐技术团队负责人
知乎推荐系统的实践及重构之路

知乎现在拥有接近 2 亿的注册用户规模,并已经产生超过1.1亿条的回答。在链接人和知识的路径中,知乎拥有大量的推荐场景,需要一个通用的、并且支持快速业务接入的推荐系统框架。因此,我们花了比较久的时间重构了知乎的推荐系统框架。本次演讲将完整讲述知乎推荐系统的重构过程中的经验和心得,接着介绍一些与业务结合中遇到的问题和解决思路。在推荐之路上,知乎是其中一家的践行者,听众将从本次演讲中对工业界的推荐系统有一个全局的了解,对实际工作遇到个各种推荐问题有更深的认识,并会了解到知乎解决这些问题的思路和方法。

内容概要

1. 背景

(1)知乎现状

(2)知乎各类的推荐场景

(3) 知乎推荐系统的现状

2. 推荐系统的重构

3. 业务结合的实践

by 张俊林

新浪微博
AI Lab资深算法专家
FFM及DeepFFM模型在推荐系统的探索及实践

FM模型目前广泛使用在互联网公司的大规模推荐系统中并取得了很好的应用效果,FFM模型作为FM模型的改进版,一般情况下效果是优于FM模型的,但是因为参数量过多导致这个模型大规模实用化存在严重问题。

本演讲主要分享微博在FFM模型及DeepFFM模型应用在推荐系统所做的一系列优化探索工作。首先会对FM/FFM模型各自的特点及应用场景进行介绍,同时会介绍FFM的几种不同的深度学习版本DeepFFM模型。除此外会分享我们针对FFM及DeepFFM模型的一些改进工作。针对FFM模型参数量过大的问题,我们通过结合FM及FFM模型各自的优点进行了针对性的优化,新模型既有接近于FFM的效果又能大量减少参数;另外我们对DeepFFM也针对性的进行了改进并取得了较好的效果。

 

演讲提纲:

  1.  推荐任务及大规模推荐系统简介;
  2.  从FM模型到FFM模型;
  3.  如何减少FFM模型的参数量;
  4.  DeepFFM模型应用在推荐系统;
  5.  对DeepFFM模型的优化改进及应用;

 

听众收益:

  1.  可以透彻了解工业界常用的推荐模型及其适用场景;
  2.  可以了解并熟悉DeepFFM这种比较前沿的深度学习推荐模型;
  3.  可以了解一些前沿模型的缺点及若干有针对性的改进推荐模型;

by 李晗

阿里妈妈精准定向技术部
高级技术专家
深度树匹配——下一代推荐技术的探索和实践

推荐业务是互联网内容提供商进行流量分配的核心业务,也是大数据和机器学习技术的典型应用场景。以电商环境为例,推荐技术的核心任务是要完成从全部海量商品库高效检索TopK相关商品给用户。为实现这一目标,推荐技术经历了以Item-CF为代表的基于统计启发式规则,到以内积模型为代表的向量检索技术的演进和发展。但当前基于内积检索的推荐技术虽然突破了全量候选集召回的天花板,一定程度引入深度模型优化推荐效率,但内积结构模型表达能力存在局限,无法利用更先进模型进一步提升推荐效果。如何在全库检索的基础上突破模型能力天花板,是下一代工业级推荐技术的可行性发展方向。

本次分享将会介绍阿里妈妈精准算法团队围绕全库检索+先进模型这一目标,自主提出的深度树匹配技术Tree-based Deep Match(TDM)这一全新的推荐算法框架。我们将会详细讲述,在具体实现层面如何根据树结构提出兴趣概率最大堆模型,并由此推演出一整套采样、检索、建模的方法。此外我们会详细介绍深度树匹配技术一方面在广告业务上的应用成果和学术创新性探索,该工作也被收录到KDD2018。与此同时,我们还将从下一代工业级推荐技术持续发展的视角,讲述围绕深度树匹配技术进一步发展的探索和思考。

内容概要:

1. 什么是推荐问题和推荐技术

2. 深度树匹配——下一代推荐技术的探索

3. 成为下一代推荐技术的核心挑战

4. 深度树匹配——下一代推荐技术探索的再思考

 

听众收益:

1. 了解推荐技术的演进历程

2. 了解推荐技术最前沿的实践探索

3. 了解推荐技术持续发展的方向和原动力

by 张扬

百度
知识图谱部算法团队负责人
基于知识的搜索推荐技术及应用

在搜索任务中,Query-Doc的文本相似度计算一直都是其中最核心的一个难题。传统的搜索文本相关性模型如BM25等,由于字符空间本身的局限性,很难实现与query语义一致但表达不一致的doc的召回。随着深度模型在NLP应用的普及,基于向量空间的DSSM模型在搜索的任务上也表现出来亮眼的效果。

而实际上,无论是字符空间还是向量空间,都并不符合人类的思维逻辑。而基于知识图谱,加之基于知识的文本认知技术,如命名实体识别、Entity Linking、篇章核心实体识别、篇章主题分类等,我们可以将query、doc,甚至用户的意图、兴趣全部与知识进行关联,将其形式化表达,并在知识空间中模拟人类的思维逻辑,进行检索、推理运算,从而找到更加语义化的搜索结果,甚至直接给出问题答案,大幅度提升了百度搜索的用户体验。

而在基于兴趣点推荐技术上,由于用户的兴趣存在多粒度的多维度情况,很难基于扁平的兴趣点来精细刻画,而基于知识空间的兴趣体系,能够对用户及资源进行体系化表示,并基于图谱中实体之间的关系数据,通过在线的层级推荐计算,为用户推荐最合适粒度资源,并且所有的推荐结果均具有可解释性。

演讲提纲:

1. 图谱构建 —— 知识空间构建与知识表示

2. 知识认知技术 —— 从文本空间到知识空间

3. 知识计算 —— 基于知识空间的搜索与推荐

听众受益:

1. 了解知识图谱的基本原理

2. 了解知识图谱在搜索推荐场景下应用的实际案例

by 杨燕

瓜子二手车
个性化推荐负责人
瓜子二手车个性化推荐的挑战与应对

瓜子二手车是目前国内二手车交易平台的领军者。如何帮助买家在平台上迅速挑选到满意的车源,是智能个性化推荐要解决的问题。

我们将介绍瓜子推荐场景区别于一般电商推荐场景的特点,商品有排他性,时效性强,业务链条长,用户决策谨慎等。首先,二手车商品的排他性时效性,使得常规的协同过滤方法计算用户相似度或者物品相似度已经不再适用。我们结合瓜子的业务逻辑、垂直领域的商品特点,基于物品属性与用户行为,发展出了新的物品相似度计算方法,同时也很好地解决了物品冷启动的问题。其次,瓜子业务链条长,用户的决策过程慎重,商品的排他性又使得不同用户之间的行为互相耦合。直接优化成交会面临数据稀疏、噪声大等困难,我们将长链条分拆,分别各自优化转化率。我们将分享瓜子在面对这些挑战时采用的方法,已经取得的结果。

演讲提纲:

1. 瓜子个性化推荐场景面临的挑战

2. 垂直场景下物品相似度计算

3. 长链条业务场景下的结果优化 

4. 个性化推荐实践与结果

听众受益:

1. 了解区别于传统推荐的推荐场景

2. 了解排他商品推荐的应对方法

3. 了解长链条业务整体优化方案

本网站图片存储由七牛云独家支持