AI开发者大会:2020年7月3日09:30–09:50司罗《为商业搭建语言桥梁》
目录
2020年7月3日09:30–09:50司罗《为商业搭建语言桥梁》
自然语言智能——NLP是AI皇冠上明珠
自然语言智能趋势
自然语言技术平台、翻译技术平台、NLP自学习平台
语言模型——2018年BERT影响力非常大
预训练语言模型——StructBERT
预训练语言模型——融合结构化信息
预训练语言模型——排序/机器阅读理解
自然语言智能数据知识、技术、场景迭代升级
电商翻译业务场景、钉钉翻译服务平台产品
云产品-事件分析图谱、云产品-赋能范通信、云产品-智能司法、云产品-智能合同、、云产品-智慧医疗
2020年7月3日09:30–09:50司罗《为商业搭建语言桥梁》
自然语言智能——NLP是AI皇冠上明珠
自然语言智能研究实现人与计算机之间用语言进行有效通信。它是融合语言学、心理学、计算机科学、数学、统计学于一体的科学。它涉及到自然语言和形式化语言的分析、抽取、理解、转换和产生等多个课题。自然语言处理研究是实现完整人工智能的必要技术 。
人工智能的四个阶段
- 计算智能
- 感知智能
- 认知智能
- 创造智能
自然语言智能趋势
- 1.深度语言模型突破式发展,引领重要自然语言技术取得进展
- 2.共有云NLP技术服务从通用功能走向定制化服务
- 3.自然语言技术逐步与行业/场景紧密结合,产生更大价值
自然语言技术平台、翻译技术平台、NLP自学习平台
语言模型——2018年BERT影响力非常大
描述自然语言的表示,顺序,结构,意义,生成的过程以及如何使用与语言相关的应用任务。
- 语言学方法:使用语言学文法(如上下文相关文法)来描述正规的语言表示形式和意义一新语言,新语法新意义在不断变化和涌现,纯规则的方式局限性大。
- 数据驱动方法统计学/深度学习:通过大最的语料和一些相关应用任务,学习语言的表示和结构一利用海I的语料信息自学习,适应于广阔场景和应用 。
预训练语言模型——StructBERT
预训练语言模型——融合结构化信息
预训练语言模型——排序/机器阅读理解
- 1、检索Retrieval
Query生成方案,通过till练基于pointer-generator的摘要生成模型, 引入copy机制和attention over attention机制提升quer词生成准确度,用生成的query对原文档进行document expansion提升召回。 - 2、排序Rankin
在预训练语言模型StructBERT中引入拒识弱监,并再利用预till练好的StructBERT模型在排序任务的label数据上进行Ranking精排,产出最终文档排序结果。
自然语言智能数据知识、技术、场景迭代升级
电商翻译业务场景、钉钉翻译服务平台产品
云产品-事件分析图谱、云产品-赋能范通信、云产品-智能司法、云产品-智能合同、、云产品-智慧医疗