NLP技术和应用

会议室:和合厅B
出品人:张俊林

人工智能技术的发展尤其是深度学习技术的成功运用,推动自然语言处理(NLP)进入了... 展开 >

专题出品人:张俊林

新浪微博机器学习团队 AI Lab 负责人

张俊林,中国中文信息学会理事,中科院软件所博士。目前担任新浪微博机器学习团队 AI Lab 负责人。在此之前,张俊林曾经在阿里巴巴任资深技术专家并负责新技术团队,以及在百度和用友担任技术经理及技术总监等职务。他是技术书籍《这就是搜索引擎:核心技术详解》(该书荣获全国第十二届优秀图书奖)、《大数据日知录:架构与算法》的作者。

他本科毕业于天津大学管理学院,之后在中科院软件所直接攻读博士学位,研究方向是信息检索理论与自然语言处理,就学期间曾在 ACL2006、COLING2004、IJCNLP2004 等国际顶级会议发表多篇学术论文。另外,他在此期间领导设计的搜索系统曾在美国国防部 DARPA 主持的 TREC 高精度检索系统评测中取得综合排名第一名的优异成绩。近年来,陆续在 Recsys2019 以及 ICDM2019 等国际会议发表多篇深度学习推荐系统相关论文。

地点:和合厅B

专题:NLP技术和应用

人工智能技术的发展尤其是深度学习技术的成功运用,推动自然语言处理(NLP)进入了高速发展阶段。NLP 目前也是应用范围广泛、成熟的人工智能技术之一,已在知识图谱、机器翻译、阅读理解等方面得到了大规模应用。

本专题将邀请相关技术专家,分享NLP技术进展和实践,详细解读NLP技术在各行业的应用和商业化落地,包括应用场景、业务痛点、商业化挑战、如何破局等宝贵实践经验,并就NLP的发展趋势进行探讨和展望。

by 黄非

阿里巴巴
达摩院 MIT 语言技术实验室研究员

作为人工智能技术的一个重要子领域,自然语言处理(NLP)在最近几年得到了飞速的发展和进步,特别是在数字经济时代新零售背景下,在商品信息的抽取、营销内容的优化、商品标题详情的改写和翻译、用户画像和评论的归纳、智能客服等均有广泛的应用。这次分享,在简要介绍自然语言处理技术的整体框架和最近发展的基础上,将会重点介绍信息抽取、对话机器人、自动问答、内容管控、机器翻译等技术在阿里巴巴新零售中的具体应用,也会展示一些相关的技术在其他行业的应用场景。

听众受益

1. 了解近年来 NLP 技术发展趋势;

2. 了解 NLP 技术在阿里巴巴内部丰富的应用和价值;

3. 了解 NLP 技术在阿里经济体生态中的应用、挑战和机会。

by 宫叶云

微软亚洲研究院
主管研究员

by 李浩然

京东云与AI
自然语言部算法工程师

自然语言生成(NLG)是自然语言处理领域的一个重要研究方向,被广泛应用于文本摘要、对话生成、诗歌生成、报表描述生成、新闻和天气预报生成等。在零售及电商领域,数百万的写作达人每天为商品创作卖点突出、风格多样的营销文案以促进用户下单,达人赚取佣金。为解决达人创作商品文案成本高、量产性差、质量参差不齐的问题,利用 NLG 技术为商品自动生成营销文案极具应用前景。

本次分享将介绍京东云与 AI-语音语义及对话实验室在商品营销文案自动生成方面的实践,包括实践过程中的挑战和解决方案,希望给关注文本生成技术的与会者带来启发和帮助。具体地,我们提出的融合商品多源(商品标题文本、商品详情介绍文本和商品知识图谱等)和多模态(文本和图片)信息的文本生成模型,通过提取商品的卖点、要素和属性,实现可控的商品营销文案生成,在文本多样性、流畅性和忠实度方面均得到显著提升。相关研究发表在 AAAI2020。

内容大纲

1、自然语言生成(NLG)前沿技术与应用简介

2、商品营销文本自动生成面临的挑战

  • 商品营销文本自动生成的任务定义
  • 商品营销文本自动生成的模型框架
  • 挑战1:文本多样性问题
  • 挑战2:文本流畅性问题
  • 挑战3:文本忠实度问题

3、文本多样性问题解决方案

  • 融合商品图片的多模态文本生成
  • 基于商品要素的文本生成
  • 强化商品卖点的文本生成
  • 模型效果

4、文本流畅性问题解决方案

  • 基于 N-Gram 语言模型的 beam search 重排序策略
  • 基于句间流畅度模型的 beam search 重排序策略
  • 模型效果

5、文本忠实度问题解决方案

  • 文本生成模型的 Copy 机制
  • 基于商品属性文本 Only-copy 的忠实度策略
  • 模型效果

6、商品营销文本自动生成的算法实践

  • 在京东发现好货的算法实践
  • 在对话机器人京小智的算法实践
  • 在搭配购的算法实践

7、展望和总结

  • 千人千面的商品营销文本自动生成
  • 面向点击率的商品营销文本自动生成

听众受益

  • 可以全面掌握自然语言文本生成的前沿技术、研究动态等;
  • 可以了解文本生成技术在电商领域的落地场景、面临的挑战、成功应用的经验及未来的机会;
  • 为业内提供商品营销文案自动生成的新思路。

by 蒋欣

华为
诺亚方舟实验室研究员

在无监督的语料上进行语言模型(如BERT、GPT)的预训练(Pre-Training),并在下游 NLP 任务上微调(fine-tuning),已经成为自然语言处理的新范式。诺亚方舟实验室语音语义团队在预训练语言模型上进行了研究和探索,推出了哪吒(NEZHA)预训练语言模型,包含中文、英文及多语言版本,在多项下游 NLP 任务上达到了 SOTA 效果。此外,由于语言模型的规模较大,无法高效地在线上或端侧设备上使用,我们研发了基于 Transformer 结构的预训练模型压缩技术 TinyBERT,能够将模型大小压缩 7.5 倍,推理速度提升 9.4 倍,并很大程度保持了在下游任务上的精度。 哪吒和 TinyBERT 已经在华为的产品中落地应用,同时我们也开源了代码和模型。

本次演讲将会重点介绍华为诺亚方舟实验室在预训练预言模型及其小型化方面的技术探索,希望可以给大家带来一些启发和思考。

内容大纲

1. 华为诺亚方舟实验室总体介绍

  • 华为诺亚方舟实验室的研究方向
  • 诺亚方舟实验室在语音语义领域的研究简介

2. 预训练语言模型基础

  • BERT/GPT 模型
  • 多语言预训练模型

3. 哪吒预训练模型

  • 在 GPU 集群训练大规模的预训练模型
  • 在华为昇腾 AI 计算集群训练大规模的预训练模型

4. 预训练模型小型化

  • TinyBERT 蒸馏压缩技术
  • TinyBERT 量化压缩技术

5. 总结

听众收益

  • 了解预训练语言模型的最新进展;
  • 了解大规模预训练模型如何在真实业务上落地。

by 何中军

百度
人工智能技术委员会主席

自然语言处理是人工智能领域的重要方向之一。近年来, 在算法、算力、数据三驾马车的驱动下,取得了长足的进展。本次报告,将整体介绍百度在语言理解和生成等方面的最新进展,包括知识增强的持续学习语义理解技术 ERNIE 以及开发套件 TextOne,高质量、低时延的语音到语音同传系统等,并结合大规模产业化实践,介绍自然语言处理技术的落地应用。

内容大纲

  1. 百度自然语言处理技术介绍及产业化应用;
  2. 可持续学习的语义理解框架 ERNIE 及开发套件 TextOne;
  3. 机器同传最新进展;
  4. 总结与展望。

听众受益

  1. 了解 NLP 最新技术进展;
  2. 了解 NLP 产业化实践;
  3. 了解功能丰富的 NLP 开发工具及平台。

by 王士进

科大讯飞
北京研究院院长

智能语音语言技术旨在让机器“掌握”人类独有的语音和语言能力,包含语音识别、语音合成、机器翻译和语言理解等关键技术,近年来在深度学习的推动下取得了长足进步。多语种语音语言技术在人类语言互通、人机交互无障碍方面具有广阔的应用前景,受到业界的广泛关注。本次分享,在简要回顾多语种语音语言技术发展基础之上,重点介绍科大讯飞多语种最新技术进展和产业化应用实践,最后探讨多语种技术面临的挑战和未来的发展趋势。

听众受益

1. 了解多语种语音语言技术框架;

2. 了解科大讯飞在多语种技术上的最新进展和应用实践;

3. 了解多语种中技术面临的挑战和未来发展趋势。

交通指南

© 2020 Baidu - GS(2019)5218号 - 甲测资字1100930 - 京ICP证030173号 - Data © 长地万方
想要批量报名或更多优惠?
立即联系票务小姐姐 Amy
或致电:+86-15615403186