李春生,现任苏宁易购搜索技术总监,负责商品、情报与搜索技术线架构设计与核心技术规划等方面的工作,在搜索领域有多年的实战经验,从0到1构建苏宁易购搜索平台,在搜索领域上耕耘7年有余,精通搜索架构设计与性能优化,同时在机器学习、大数据等领域对搜索的场景化应用有丰富的经验。
李春生,现任苏宁易购搜索技术总监,负责商品、情报与搜索技术线架构设计与核心技术规划等方面的工作,在搜索领域有多年的实战经验,从0到1构建苏宁易购搜索平台,在搜索领域上耕耘7年有余,精通搜索架构设计与性能优化,同时在机器学习、大数据等领域对搜索的场景化应用有丰富的经验。
搜索引擎作为网站的主要流量入口,搜索的用户体验对整个网站起到至关重要的作用,优化搜索、提升用户体验,首先需要大量的数据,用户行为数据、商品专家数据以及海量的用户输入表达数据。其次需要机器学习算法针对既有的数据进行学习与组织数据,建立合理的模型,用数据去理解用户创建用户画像,同时还需要及时识别各种异常情况,对异常行为数据进行相应的惩处措施,在充分了解用户行为与商品模型的前提下为用户提供更优的搜索体验。
本次分享主要基于多年搜索实践经验,讲述搜索如何利用机器学习在商品排序、用户意图识别、商品异常检测、异常流量检测、架构优化等方面的应用。
议题大纲:
1. 搜索系统总体介绍
(1)苏宁易购搜索系统范围
(2)苏宁易购搜索系统架构演变
2. 搜索系统面临哪些难题
(1)用户意图的理解
(2)如何智能纠正与扩展用户query
(3)商品乱挂现象影响搜索排序
(4)作弊给搜索带来的影响
3. 如何利用机器学习技术解决搜索难点
(1)基于CRF的中心词识别模型
(2)基于知识图谱的query扩展
(3)基于CNN与Naive Bayes实现图片与文本类别识别
(4)基于常用分类器实现的黑白分类检测作弊行为
4. 问答式内容搜索系统试水
(1)搜索的召回更加丰富性
(2)基于NLP技术对query进行处理
(3)基于知识图谱进行查询推导
(4)问答式搜索适用场景与用户
听众受益点:
适合从事电商类搜索从业的同行,搜索面临的问题很多都是共性问题,各家解决方案不一样,但是目的都是一致的。搜索的道路没有捷径,需要长期的沉淀,数据积累与长期的实践,分享的目的是让大家互相了解同行的解决方案,互相取长补短。共同提升搜索能力,提升用户搜索体验。