半监督学习方法（Semi-supervised Learning）的分类

根据模型的训练策略划分：
- 直推式学习（Transductive Semi-supervised Learning）
  - 无标记数据就是最终要用来测试的数据，学习的目的就是在这些数据上取得最佳泛化能力。
- 归纳式学习（Inductive Semi-supervised Learning）
  - 认为待识别样本不能是训练中所用的无标签数据，不能参与到训练过程。

这两者的区别在于：预测样本是不是在训练的时候已经见（用）过。通常直推式比归纳式的效果要好，因为归纳式还需要从训练泛化到测试。

根据无标签数据的使用方法划分：
- 被动学习
  - 随机选取无标签样本并打标，侧重于学习探索无标注数据中的模型已知部分。
- 主动学习
  - 对无标签数据筛选后打标，相比于被动学习，在获取相当性能的情况下只需要更少但更有信息量的标注样本；侧重尝试挖掘未知的富有信息量的数据。
按照模型的训练方法划分：
- Self-training methods（自训练方法）
  - 训练过程：首先要用一个带有标签的小数据集训练分类器；然后使用分类器对未标记的数据进行分类；之后将最可靠的未标记点与预测标记一起添加到训练集中，分类器被重新训练。重复此过程，直到程序满足终止条件为止，然后在输出中给出最终的分类器。（自训练首先将原始标注数据作为训练集训练得到初步模型,再用该模型对无标注数据进行推断,将那些高置信度的预测样本作为伪真值(Pseudo Ground Truth)加入训练集,再重复训练,因此自训练也可叫做自我学习(Self teaching)或自助法(Bootstrapping)。）
  - 存在的问题：错误标记的样本会传播到下一个迭代中，从而对结果产生很大影响。
  - 解决方法：在每次迭代中都需要自训练程序来找到一个准则（度量）以选择一组高度可靠的预测 。如果预测的可靠性下降到阈值以下，则尝试通过“取消学习”未标记的点来避免标签不正确对分类结果的影响。
- Co-training methods（协同训练方法）
  - 该方法基于视图充分冗余和条件独立这两个假设。首先在有同一标记的样本的两个视图上训练不同的分类器（比如对于一个电影：有画面、声音、字幕三种属性集，对应的就有三个视图；对于图片，可以是两个角度拍摄出的同一个对象的不同照片），并利用这两个分类器进行未标记样本的标签预测；之后将其中置信值最高的样本加入到另一个分类器中交替进行训练（协同训练），并迭代进行下去。
  - 协同训练可以很好地利用多视图的“相容互补性”。假设数据拥有两个充分且条件独立的视图（“充分”是指每个视图都包含足以产生最优学习器的信息，“条件独立”则是指在给的类别标记条件下两个视图相互独立），在此情况下，可以用一个简单的办法来利用未标记数据：首先在每个视图上基于有标签样本分别训练出一个分类器，然后让每个分类器分别去挑选自己“最有把握的”未标记样本赋予伪标记，并将伪标记样本提供给另一个分类器作为新增的有标记样本用于训练更新…这个“互相学习、共同进步”的过程不断迭代进行，直到两个分类器都不再发生变化，或达到预先设定的迭代轮次为止。
  - 协同训练(Co-training)基于三大假设:(1)特征可划分为两大子集;(2)每个特征子集足够训练好的分类器“3)给定类别前提下两个特征子集条件独立。协同训练通过引入无标注的数据来缩小变形空间从而达到提升半监督学习算法性能的目的。
- Semi-supervised boosting（半监督提升）
  - Boosting是一种框架算法，主要是通过对样本集的操作获得样本子集，然后用弱分类算法在样本子集上训练生成一系列的基分类器，使用基分类器生成强分类器。
  - Semi-supervised on-line boosting for robust tracking
- Generative methods（生成式方法）
  - 生成式方法是一种基于统计学习的方法，它认为训练样本和对应的类别标签是由某个概率分布生成。已知类先验分布
    
    半监督学习方法（Semi-supervised Learning）的分类的更多相关文章
    1. 详解使用EM算法的半监督学习方法应用于朴素贝叶斯文本分类
      1.前言对大量需要分类的文本数据进行标记是一项繁琐.耗时的任务,而真实世界中,如互联网上存在大量的未标注的数据,获取这些是容易和廉价的.在下面的内容中,我们介绍使用半监督学习和EM算法,充分结合大量 ...
    2. [论文][半监督语义分割]Adversarial Learning for Semi-Supervised Semantic Segmentation
      Adversarial Learning for Semi-Supervised Semantic Segmentation 论文原文摘要创新点:我们提出了一种使用对抗网络进行半监督语义分割的方法 ...
    3. 数据量与半监督与监督学习 Data amount and semi-supervised and supervised learning
      机器学习工程师最熟悉的设置之一是访问大量数据,但需要适度的资源来注释它.处于困境的每个人最终都会经历逻辑步骤,当他们拥有有限的监督数据时会问自己该做什么,但很多未标记的数据,以及文献似乎都有一个现成的 ...
    4. Machine Learning Algorithms Study Notes(2)--Supervised Learning
      Machine Learning Algorithms Study Notes 高雪松 @雪松Cedro Microsoft MVP 本系列文章是Andrew Ng 在斯坦福的机器学习课程 CS 22 ...
    5. A brief introduction to weakly supervised learning（简要介绍弱监督学习）
      by 南大周志华摘要监督学习技术通过学习大量训练数据来构建预测模型,其中每个训练样本都有其对应的真值输出.尽管现有的技术已经取得了巨大的成功,但值得注意的是,由于数据标注过程的高成本,很多任务很难 ...
    6. GAN实战笔记——第七章半监督生成对抗网络（SGAN）
      半监督生成对抗网络一.SGAN简介半监督学习(semi-supervised learning)是GAN在实际应用中最有前途的领域之一,与监督学习(数据集中的每个样本有一个标签)和无监督学习(不使 ...
    7. 小样本利器2.文本对抗+半监督 FGSM & VAT & FGM代码实现
      小样本利器2.文本对抗+半监督 FGSM & VAT & FGM代码实现上一章我们聊了聊通过一致性正则的半监督方案,使用大量的未标注样本来提升小样本模型的泛化能力.这一章我们结合FG ...
    8. cips2016+学习笔记︱NLP中的消岐方法总结（词典、有监督、半监督）
      歧义问题方面,笔者一直比较关注利用词向量解决歧义问题: 也许你寄希望于一个词向量能捕获所有的语义信息(例如run即是动车也是名词),但是什么样的词向量都不能很好地进行凸显. 这篇论文有一些利用词向量的 ...
    9. OSVOS 半监督视频分割入门论文（中文翻译）
      摘要: 本文解决了半监督视频目标分割的问题.给定第一帧的mask,将目标从视频背景中分离出来.本文提出OSVOS,基于FCN框架的,可以连续依次地将在IMAGENET上学到的信息转移到通用语义信息,实 ...
    随机推荐
    1. html5 image>usemap (attribute)
      # html5 image>usemap (attribute) https://caniuse.com/#search=usemap http://www.w3.org/TR/html5 ...
    2. OOP & 模块化, 多态, 封装
      OOP 面向对象编程 (OOP) 是用抽象方式创建基于现实世界模型的一种编程模式.它使用先前建立的范例,包括模块化,多态和封装几种技术. 在 OOP 中,每个对象能够接收消息,处理数据和发送消息给其他 ...
    3. SVG 与 Canvas 对比
      SVG 与 Canvas 对比技术选型 SVG vs Canvas 应用场景性能 GPU 加速 XML 数据存储 Canvas 2D Canvas 3D WebGL / OpenGL ES thr ...
    4. bob and brad physical therapy knee exercise
      bob and brad physical therapy knee exercise 鲍勃和布拉德物理治疗膝关节运动 https://bobandbrad.com/ youtube https:// ...
    5. Typescript & React & Vue
      Typescript & React & Vue Typescript & React https://facebook.github.io/create-react-app/ ...
    6. ES6 Arrow Function return Object
      ES6 Arrow Function return Object https://github.com/lydiahallie/javascript-questions/issues/220#issu ...
    7. asm align 对齐数据
      最大成员dword data: dd 1 db 2 align 4 dw 3 000E0010 - 01 00 00 00 000E0014 - 02 00 00 00 000E0018 - 03 0 ...
    8. git alias & zsh
      git alias & zsh VPN & git work tree # git pull === gp ➜ .git git:(feature/select-seat-system ...
    9. APP 金刚区图标设计 & UI
      APP 金刚区图标设计 & UI https://www.zcool.com.cn/article/ZNzk4Njg0.html
    10. BGV再度爆发，流通市值破500万美金！
      BGV似乎以超乎寻常的姿态,开启了爆发的模式.这两天,BGV一路上涨,日内最高涨至548.78美金,24小时成交额达到了98.07万美金,24小时成交量达到1844.93枚BGV,流通市值更是突破了5 ...

半监督学习方法（Semi-supervised Learning）的分类

根据模型的训练策略划分：

根据无标签数据的使用方法划分：

按照模型的训练方法划分：

半监督学习方法（Semi-supervised Learning）的分类的更多相关文章

随机推荐

热门专题