前两个也许跟上了，后两个完全没跟上，以后再详细读读吧qwq

反正组会跟不上才是正常现象。

AugGPT: Leveraging ChatGPT for Text Data Augmentation

摘要、引言、相关工作

当下数据增强两个缺陷

真实性不足，有的跟原始 label 有偏移
生成的数据缺乏紧凑性

利用 ChatGPT 改进先前的数据增强方法

FSL（few shot learning）：

下游上只有 1-2 个样本

RW

数据增强方法：

character level
1. OCR 这种自带的缺陷做数据增强，比如 O -> 0
word level
1. 随机替换、反转、删除
2. 同义词替换
contextual
1. 利用预训练模型本身自有的知识做数据增强
sequence
1. 翻译过去再翻译回来

模型

AugGPT 的框架

把原始的话输入 ChatGPT 中，然后让它改写。
BERT 做 mask 的预测

Loss

做了对比损失

实验

数据集

Amazon dataset：24 类，分类
Symptoms Dataset：分类症状
PubMed20k Dataset：分类

指标

余弦相似度
- 跟 BERT 类似，把 [CLS] 取出来，然后比较余弦相似度
信息熵相关的某个指标（Transrate）

结果

ChatGPT 在 Symptoms 上取得了爆炸的效果（我估计是练过），作者认为是这个数据集比较简单

prompt design

On the Robustness of ChatGPT: An Adversarial and Out-of-distribution Perspective

摘要、引言、相关工作

鲁棒性是可解释性的一个指标，因此本文从对抗和 OOD（这个 OOD 只能拿 22 年以后数据的测试）做分析。

例如，尝试用虚假新闻骗过 ChatGPT。

9 个任务，超过 2089 个样本上分析。

ChatGPT 在 Adverseral 和 OOD 上都优于先前的模型。

ChatGPT 在哪些方面做的好
1. ChatGPT 翻译任务上表现比较好
2. ChatGPT 在 Adverseral 和 OOD 上都比较好
3. 对话表现好
表现不好：
1. ChatGPT 和人类认为它的水平有差距
2. 翻译任务上不如 text-davinci-003
3. ChatGPT 对于医学领域相关的问题无法给出确定答案，只能给出一些建议。

模型

两个任务的目标函数

实验

数据集

结果

ChatGPT 表现最好

ChatGPT 在对抗数据集上都表现很好
所有 GPT-2 这一系列的模型都在 OOD 数据集上表现很好
ChatGPT 比较其他的大模型在基于对话的理解上表现更好

Dense Passage Retrieval for Open-Domain Question Answering

摘要、引言、相关工作

Sparse Retrieval
Dense Retrieval
自回归检索（Autoregressive retrieval）

作者提问：是否可以只用（问题，文章）对在没有额外的与训练是训练一个更好的 dense 潜入模型？

模型

Loss

以下有几种负例构建方式：

随机从语料库中选负例
BM25 找出来不包括答案但是匹配大多数问题词元的负例
Gold：与训练集中出现的其他问题配对的积极段落

实验

结果

负例越多，效果可能越好

A Neural Corpus Indexer for Document Retrieval

据说本篇有很大争议

摘要、引言、相关工作

作者认为：

dense retrieval 和 term-based retrieval 都没有办法充分利用神经网络的能力。
模型不能合成深度的查询-文档交互。

模型

实验

后面跟不上了

2023/3/21 组会：ChatGPT 对数据增强的影响及 ChatGPT 的鲁棒性，Dense 和 Document 检索方法的更多相关文章

SQL Server里在文件组间如何移动数据？
平常我不知道被问了几次这样的问题:“SQL Server里在文件组间如何移动数据?“你意识到这个问题:你只有一个主文件组的默认配置,后来围观了“SQL Server里的文件和文件组”后,你知道,有多 ...
将如下三组不同类型的数据利用DataInputStream和DataOutputStream写入文件,然后从文件中读出
三组数据如下: {19.99 , 9.99 , 15.99 , 3.99 , 4.99} {12 , 8 , 13 ,29 ,50} {"Java T-shirt" , " ...
SQL分组排序后取每组最新一条数据的另一种思路
在hibernate框架和mysql.oracle两种数据库兼容的项目中实现查询每个id最新更新的一条数据. 之前工作中一直用的mybatis+oracle数据库这种,一般写这类分组排序取每组最新一条 ...
国内“谁”能实现chatgpt，短期穷出的类ChatGPT简评（算法侧角度为主），以及对MOSS、ChatYuan给出简评，一文带你深入了解宏观技术路线。
1.ChatGPT简介[核心技术.技术局限] ChatGPT(全名:Chat Generative Pre-trained Transformer),美国OpenAI 研发的聊天机器人程序 ,于202 ...
(转)如何用TensorLayer做目标检测的数据增强
数据增强在机器学习中的作用不言而喻.和图片分类的数据增强不同,训练目标检测模型的数据增强在对图像做处理时,还需要对图片中每个目标的坐标做相应的处理.此外,位移.裁剪等操作还有可能使得一些目标在处理后只 ...
HLJU 1046: 钓鱼(数据增强版) （贪心+优化）
1046: 钓鱼(数据增强版) Time Limit: 1 Sec Memory Limit: 128 MB Submit: 11 Solved: 3 [id=1046">Subm ...
Deep Learning -- 数据增强
数据增强在图像的深度学习中,为了丰富图像训练集,更好的提取图像特征,泛化模型(防止模型过拟合),一般都会对数据图像进行数据增强,数据增强,常用的方式,就是旋转图像,剪切图像,改变图像色差,扭曲图像特 ...
Generalizing from a Few Examples: A Survey on Few-Shot Learning 小样本学习最新综述 | 三大数据增强方法
目录原文链接:小样本学习与智能前沿 01 Transforming Samples from Dtrain 02 Transforming Samples from a Weakly Labeled ...
ChatGPT国内镜像模板，国内使用ChatGPT中文版本
@ 目录一.什么是ChatGPT国内镜像二.ChatGPT国内镜像使用教程免费ChatGPT镜像的功能: 三.ChatGPT中文版作用四.怎么使用ChatGPT国内镜像五.中文ChatGPT ...
PCTUSED和PCTFREE对数据操作的影响
1概念理解首先PCTUSED和PCTFREE都是针对数据块的存储属性,单位都是%.其中PCTFREE决定了数据块什么时候从free list中移除,系统就不可以再往该数据块中插入数据,对于数据块中已 ...

随机推荐

WPF 如何知道当前有多少个 DispatcherTime 在运行
在 WPF 调试中,对于 DispatcherTimer 定时器的执行,没有直观的调试方法.本文来告诉大家如何在 WPF 中调试当前主线程有多少个 DispatcherTimer 在运行在 WPF ...
2019-2-27-VisualStudio-插件-翻译注释
title author date CreateTime categories VisualStudio 插件翻译注释 lindexi 2019-02-27 15:50:33 +0800 2019- ...
k8s七层代理Ingress-nginx-controller
一.Ingress与Ingress Controller概述 1.1 回顾service四层代理在 k8s 中为什么要做负载均衡? Pod 漂移问题,可以理解成 Pod IP 是变化的 Kubern ...
LVGL 日志
一.启动日志在 lv_conf.h 中将 LV_USE_LOG 设置为 1,如下图所示: 二.日志级别在文件 lvgl/src/misc/lv_log.h 中定义了日志等级,等级是从小到大,所以 ...
大模型_2.2：Prompt示例
1.行业洞察分析行业洞察分析的方法论:使用麦肯锡工作法可以快速了解一个行业. Step1:通过搜索分析几十个与该行业相关的关键词,覆盖该行业的上下游,以获取全面的信息. Step2:阅读一些行业最新 ...
FFmpeg开发笔记（十八）FFmpeg兼容各种音频格式的播放
FFmpeg结合SDL可以播放音频文件,也能播放视频文件中的音频流,<FFmpeg开发实战:从零基础到短视频上线>一书第10章的示例程序playaudio.c支持播放mp3和aac两种格 ...
Dash 2.17版本新特性介绍
本文示例代码已上传至我的Github仓库https://github.com/CNFeffery/dash-master 大家好我是费老师,不久前Dash发布了其2.17.0版本,执行下面的命令进行最 ...
03.redis 事务
课程学习地址: https://www.bilibili.com/video/BV1S54y1R7SB?p=23 中间手册地址: http://www.redis.cn/ Redis事务本质:一组命令 ...
关于armcc中static __inline修饰符的记录
相关的知识点:内联函数,static关键字在一次stm32的库代码分析中发现static __inline 的函数定义,对此有些疑惑,static和inline两个关键字为什么要进行连用呢? 对此进 ...
Python语言：散修笔记
文章目录前言转义字符的使用原字符变量的定义类型转换注释接收用户信息运算规则整除运算幂运算比较运算符布尔运算运算优先级对象的布尔值 if else elif分支结构条件表达 ...

2023/3/21 组会：ChatGPT 对数据增强的影响及 ChatGPT 的鲁棒性，Dense 和 Document 检索方法

AugGPT: Leveraging ChatGPT for Text Data Augmentation

摘要、引言、相关工作

RW

模型

AugGPT 的框架

Loss

实验

数据集

指标

结果

prompt design

On the Robustness of ChatGPT: An Adversarial and Out-of-distribution Perspective

摘要、引言、相关工作

模型

两个任务的目标函数

实验

数据集

结果

Dense Passage Retrieval for Open-Domain Question Answering

摘要、引言、相关工作

模型

Loss

实验

结果

A Neural Corpus Indexer for Document Retrieval

摘要、引言、相关工作

模型

实验

2023/3/21 组会：ChatGPT 对数据增强的影响及 ChatGPT 的鲁棒性，Dense 和 Document 检索方法的更多相关文章

随机推荐

热门专题