张扬,历任百度数据挖掘与机器学习工程师,资深工程师及技术经理,现任知识图谱算法团队负责人,负责知识图谱构建及图谱认知核心算法的研发,多次主导了知识图谱与百度搜索、百度信息流、DuerOS、百度地图等业务的合作项目,在大规模知识图谱构建及应用方面具有丰富的实战经验。
张扬,历任百度数据挖掘与机器学习工程师,资深工程师及技术经理,现任知识图谱算法团队负责人,负责知识图谱构建及图谱认知核心算法的研发,多次主导了知识图谱与百度搜索、百度信息流、DuerOS、百度地图等业务的合作项目,在大规模知识图谱构建及应用方面具有丰富的实战经验。
在搜索任务中,Query-Doc的文本相似度计算一直都是其中最核心的一个难题。传统的搜索文本相关性模型如BM25等,由于字符空间本身的局限性,很难实现与query语义一致但表达不一致的doc的召回。随着深度模型在NLP应用的普及,基于向量空间的DSSM模型在搜索的任务上也表现出来亮眼的效果。
而实际上,无论是字符空间还是向量空间,都并不符合人类的思维逻辑。而基于知识图谱,加之基于知识的文本认知技术,如命名实体识别、Entity Linking、篇章核心实体识别、篇章主题分类等,我们可以将query、doc,甚至用户的意图、兴趣全部与知识进行关联,将其形式化表达,并在知识空间中模拟人类的思维逻辑,进行检索、推理运算,从而找到更加语义化的搜索结果,甚至直接给出问题答案,大幅度提升了百度搜索的用户体验。
而在基于兴趣点推荐技术上,由于用户的兴趣存在多粒度的多维度情况,很难基于扁平的兴趣点来精细刻画,而基于知识空间的兴趣体系,能够对用户及资源进行体系化表示,并基于图谱中实体之间的关系数据,通过在线的层级推荐计算,为用户推荐最合适粒度资源,并且所有的推荐结果均具有可解释性。
演讲提纲:
1. 图谱构建 —— 知识空间构建与知识表示
2. 知识认知技术 —— 从文本空间到知识空间
3. 知识计算 —— 基于知识空间的搜索与推荐
听众受益:
1. 了解知识图谱的基本原理
2. 了解知识图谱在搜索推荐场景下应用的实际案例