NLP任务

前处理任务

前处理任务的结果可作为下游任务输入的额外特征。

POSTa(词性标注)

往模型中输入句子,对每一个token进行词性的识别。

识别出的词性可以用于下游任务。

Word Segmentation(分词)

对于英文,显然句子有天然的分词。所以分词通常是针对中文句子。

分词之后,模型的输入就可以以词汇作单位,而不再以字作单位。

以下面例子做说明:

将一个句子按字输入模型,训练模型来对每个字来进行二分类决定每个字的对应位置输出N或者Y(N/Y是词的边界标识)

Parsing(语义分析)

给定句子产生树状结构——句子的语法结构。

Coreference Rosolution(共指消解)

从一段文章或者一段对话中找出指代同一个人或事物的所有词汇。

具体NLP任务

Summarization(文本摘要)

抽取式摘要:基于二分类任务,每个句子分开考虑。

衡量文章中句子应不应该放到摘要里面,但是这么做远远不够。

生成式摘要:属于seq2seq模型,输入长文本,模型用自己的语言进行短摘要的生成。

模型的copy能力:输入文本序列和输出摘要很有可能有很多共用词汇,这些共用词汇经过模型的修改整合形成摘要的文本。因此模型需要增加输入copy能力,怎么实现?Pointer network(指针网络)。

Machine Translation(机器翻译)

seq2seq

audio2seq

audio2audio

Grammer Error Correction(语法纠正)

seq2seq?

不,杀鸡焉用牛刀。

seq2class

输入句子,做分类,输出要对token要做的动作的标识(C/R/A/D)。

C——复制,保持不变

A——在后面增加词汇

R——置换,把词换个时态或者换成别的词

D——删除

Sentiment Classfication(情感分类)

输入一段文本或者评论,训练模型,输出文本的情感分类(正面/负面)。

seq2class

Stance Detection(立场侦测)

seq2class

通过一则博文或者文章以及其下的评论回复来进行评论者所处立场的判断。

立场通常有四类:SDQC(Support、Denying、Querying and Commenting)。

立场侦测经常被用于事实预测:

事实预测:

seq2class

根据新闻消息或者博文的评论立场以及外部的知识判断消息或文章内容的真实性。

Natural Language Inference(自然语言推理)

seq2class

推理模型的文本输入:premise(前提) + hypothesis(假设)

模型输出:对假设是否成立的判断结果,矛盾/包含(可推得)/中立(contradiction/entailment/neutral)

Question Answering(问答)

传统的基于检索的问答系统

简单的(模组少):

  • 问题处理——对问题进行格式化,检测其答案的类别

  • 检索资料库——进行文档、文章的检索选择

  • 答案的生成和评估——从候选文章中抽取答案,抽取的答案根据第一步检测到的答案类别评估其正确性

复杂的(模组多):

和简单架构的区别:

  • 问题处理——模组更多

  • 候选答案生成——综合检索文章得到的候选答案和从自带的有结构资料库中调取的答案

  • 答案评分

  • 融合对等答案,返回答案及其可信度

基于深度学习的QA

seq2seq

输入问题文本和外部结构化/无结构化的知识(大多来自搜索引擎),训练模型得到问题的答案。

但是要实现直接向模型输入问题和外部知识就生成问题答案还有非常长的一段路要走。目前我们常做的只是从文本中抽取答案。

抽取式QA:

seq2seq

答案就在背景文章里面,向模型输入背景文章和问题,其实就是做通常意义上的阅读理解,模型产生抽取的答案文本在文章中的 start position 和 end position。

Dialogue(对话)

对话涉及到自然语言生成(NLG)和自然语言理解(NLU)

Chatting(闲聊)

seq2seq

聊天都是有背景的,所以模型的输入应该是增量式的,模型的输出是根据之前的对话内容产生的。

根据对话的需求可以进行定制:

Task-oriented(任务导向的对话)

seq2seq

需要实现一定的功能,比如提供订票、订餐厅、订酒店等服务

系统架构

State Tracker记录当前对话的状态

知识图

NER(命名实体识别)

seq2class

识别出句子中的人名、地名、组织等实体

RE(关系抽取)

seq2class

输入文本和文本中两个实体,训练模型得到两个实体之间的关系

关系的种类基本是固定的,因此关系抽取的模型往往是去做一个复杂的分类任务

综合任务

综合任务的意义:看模型是否是真的“理解”了人类语言,能“举一反三”

GLUE

分为三大类

  • 文本分类(语法错误检查、文本情感分析)
  • 文本相似度计算
  • 自然语言推理

Super GLUE

包含8个NLP任务,大多和QA有关

DecaNLP

同一个模型解决10个NLP任务

怎么实现?往QA的方向改造这些任务

总结

根据这些NLP任务的输入输出,把这些任务和任务相关的一些技术手段进行梳理

one on one

seq2class

  • 情感分析
  • 立场检测
  • 文本内容辨真伪
  • 文本意图识别
  • 对话决策

seq2tokenclass

  • 词性标注
  • 分词
  • 抽取式摘要
  • 命名实体识别

seq2seq

  • 抽象式摘要
  • 机器翻译
  • 文本语法矫正
  • 自然语言生成

n on one

seq2class

  • 自然语言推理
  • 搜索引擎
  • 关系抽取

copy from input

  • 抽取式QA

seq2seq

  • 常规QA
  • 任务导向对话
  • 聊天机器人
  • State Tracker

others

  • 语义分析
  • 共指消解

NLP任务梳理总结的更多相关文章

  1. ICLR2021对比学习(Contrastive Learning)NLP领域论文进展梳理

    本文首发于微信公众号「对白的算法屋」,来一起学AI叭 大家好,卷王们and懂王们好,我是对白. 本次我挑选了ICLR2021中NLP领域下的六篇文章进行解读,包含了文本生成.自然语言理解.预训练语言模 ...

  2. 【NLP】十分钟快览自然语言处理学习总结

    十分钟学习自然语言处理概述 作者:白宁超 2016年9月23日00:24:12 摘要:近来自然语言处理行业发展朝气蓬勃,市场应用广泛.笔者学习以来写了不少文章,文章深度层次不一,今天因为某种需要,将文 ...

  3. 【NLP】前戏:一起走进条件随机场(一)

    前戏:一起走进条件随机场 作者:白宁超 2016年8月2日13:59:46 [摘要]:条件随机场用于序列标注,数据分割等自然语言处理中,表现出很好的效果.在中文分词.中文人名识别和歧义消解等任务中都有 ...

  4. 【NLP】蓦然回首:谈谈学习模型的评估系列文章(一)

    统计角度窥视模型概念 作者:白宁超 2016年7月18日17:18:43 摘要:写本文的初衷源于基于HMM模型序列标注的一个实验,实验完成之后,迫切想知道采用的序列标注模型的好坏,有哪些指标可以度量. ...

  5. NLP点滴——文本相似度

    [TOC] 前言 在自然语言处理过程中,经常会涉及到如何度量两个文本之间的相似性,我们都知道文本是一种高维的语义空间,如何对其进行抽象分解,从而能够站在数学角度去量化其相似性.而有了文本之间相似性的度 ...

  6. 【NLP】基于自然语言处理角度谈谈CRF(二)

    基于自然语言处理角度谈谈CRF 作者:白宁超 2016年8月2日21:25:35 [摘要]:条件随机场用于序列标注,数据分割等自然语言处理中,表现出很好的效果.在中文分词.中文人名识别和歧义消解等任务 ...

  7. 【NLP】基于机器学习角度谈谈CRF(三)

    基于机器学习角度谈谈CRF 作者:白宁超 2016年8月3日08:39:14 [摘要]:条件随机场用于序列标注,数据分割等自然语言处理中,表现出很好的效果.在中文分词.中文人名识别和歧义消解等任务中都 ...

  8. 【NLP】基于统计学习方法角度谈谈CRF(四)

    基于统计学习方法角度谈谈CRF 作者:白宁超 2016年8月2日13:59:46 [摘要]:条件随机场用于序列标注,数据分割等自然语言处理中,表现出很好的效果.在中文分词.中文人名识别和歧义消解等任务 ...

  9. 【NLP】条件随机场知识扩展延伸(五)

    条件随机场知识扩展延伸 作者:白宁超 2016年8月3日19:47:55 [摘要]:条件随机场用于序列标注,数据分割等自然语言处理中,表现出很好的效果.在中文分词.中文人名识别和歧义消解等任务中都有应 ...

随机推荐

  1. Java基础之HashMap原理分析(put、get、resize)

    在分析HashMap之前,先看下图,理解一下HashMap的结构 我手画了一个图,简单描述一下HashMap的结构,数组+链表构成一个HashMap,当我们调用put方法的时候增加一个新的 key-v ...

  2. Dockerfile构建镜像实战

    目录 一.常见Dockerfile指令 二.编写Centos Dockerfile 2.1.编写Dockerfile 2.2.构建 2.3.查看Docker镜像 2.4.运行镜像 三.CMD和ENTR ...

  3. 关于python中break与continue的区别

    在python中break和continue都有跳出循环体的作用,但是他们还是有一些区别的,具体区别如下: break:是直接跳出循环,跳出自己所处的整个循环体 continue:只是跳出本次循环,而 ...

  4. Spring学习(四)IOC详解

    一.简介 概念:控制反转是一种通过描述(在 Java 中可以是 XML 或者注解)并通过第三方(Spring)去产生或获取特定对象的方式.(被动创建) 优势: ① 降低对象之间的耦合 ② 我们不需要理 ...

  5. appcan 文件下载与预览

    用appcan开发的app如何在手机上查看附件和预览附件呢?今天就为大家介绍一下,用APP看附件实大是太方便了. 1.直接上代码吧,首先要初始化插件用到的所有方法.这个方法中 cbIsFileExis ...

  6. Java随谈(一)魔术数字、常量和枚举

    本文适合对 Java 或 C 有一些了解的用户阅读,推荐阅读时间15分钟. 导言 写这个系列的原因? 我曾经听过一种说法,如果不了解Liunx的网络通讯,就很难理解理解Java的IO:如果不知道Jav ...

  7. Typecho反序列化漏洞

    Typecho Typecho是一款快速建博客的程序,外观简洁,应用广泛.这次的漏洞通过install.php安装程序页面的反序列化函数,造成了命令执行,Typecho 1.1(15.5.12)之前的 ...

  8. PPT画成这样,述职答辩还能过吗?

    作者:小傅哥 博客:https://bugstack.cn 沉淀.分享.成长,让自己和他人都能有所收获! 一.前言 标题有点凶,但内容很干! 大部分程序员并不会画PPT,也梳理不出架构图.工作的年头虽 ...

  9. 076 01 Android 零基础入门 02 Java面向对象 01 Java面向对象基础 01 初识面向对象 01 Java面向对象导学

    076 01 Android 零基础入门 02 Java面向对象 01 Java面向对象基础 01 初识面向对象 01 Java面向对象导学 本文知识点:Java面向对象导学 说明:因为时间紧张,本人 ...

  10. matlab中imfilter、conv2、imfilter2用法及区别

    来源 :https://blog.csdn.net/u013066730/article/details/56665308(比较详细) https://blog.csdn.net/yuanhuilin ...