【CV论文阅读】Unsupervised deep embedding for clustering analysis

Unsupervised deep embedding for clustering analysis

偶然发现这篇发在ICML2016的论文，它主要的关注点在于unsupervised deep embedding。据我所了解的，Unsupervised 学习是deep learning的一个难点，毕竟deep network这种非常复杂的非线性映射，暂时的未知因素太多，可能在原来的domain有clustering的特征数据经过nonlinear映射之后，就变得不再clustering了。

这篇论文受t-SNE的启发，优化的目标是两个分布之间的KL距离。假设deep embedding之后的两个点和，其中是第个类的centroid。于是，similarity 的measure为

也可以认为是属于的概率。

假设此时一个目标分布，则。优化的过程和普通的BP算法一样，（1）通过BP算法优化deep network的参数，即计算。（2）通过计算梯度来调整cluster的centroid，但是否这类centroid的调整也需要乘上一个学习率呢？

此外，一个重点的问题是潜在目标分布的构造。Paper里给出了三个标准，我觉得这三个标准确实挺有意义的：（1）对预测效果可以strengthen（2）对于一些高概率被标注某个cluster的点，给予更多的权重（3）归一化每个点对于每个centroid用于计算loss函数时候的贡献，避免一些大的cluster扭曲了整个feature space。构造如下，

其中，。对以上三个标准说一说自己的理解，不一定准确。（1）对于第一点，对于某个明显更靠近类的point，它比其他point离得除类以外更远，这个点的也更高，而且也可能会更高（2）平方项的应用使得小的更加小了，即emphasis更小。同时，当较高，在的所有点中，也会有相对高的值。（3）对于某些大的cluster，可能总和更大，反而最终更小，而对于小的cluster，使得更大。最终把一个点push到另一个小cluster。

直觉上说，概率分布的初始化的正确性很大程度影响的算法最终的结果，首先因为这不是一个真实的分布，而deep network没有一个很好的初始化很难在另一个domain 保持cluster的结构。而section 5.1 的结果显示，对于high confidence的点，sample也变得更加canonical，如图越高confidence越明显是“5”的字样，而对于梯度的贡献也越来越大，即说明初始化概率分布也是接近正确的。

网络的初始化和SAE（栈autoencoder）一样，采用greedy training的方式训练每一层，然后再微调整个网络。而初始化cluster的选择，则通过在embedding上perform k means clustering 算法得到。

【CV论文阅读】Unsupervised deep embedding for clustering analysis的更多相关文章

论文解读DEC《Unsupervised Deep Embedding for Clustering Analysis》
Junyuan Xie, Ross B. Girshick, Ali Farhadi2015, ICML1243 Citations, 45 ReferencesCode:DownloadPaper: ...
PP: Unsupervised deep embedding for clustering analysis
Problem: unsupervised clustering represent data in feature space; learn a non-linear mapping from da ...
【论文阅读】Deep Adversarial Subspace Clustering
导读: 本文为CVPR2018论文<Deep Adversarial Subspace Clustering>的阅读总结.目的是做聚类,方法是DASC=DSC(Deep Subspace ...
论文阅读 DynGEM: Deep Embedding Method for Dynamic Graphs
2 DynGEM: Deep Embedding Method for Dynamic Graphs link:https://arxiv.org/abs/1805.11273v1 Abstract ...
论文阅读 | Clustrophile 2: Guided Visual Clustering Analysis
论文地址论文视频左侧边栏可以导入数据,或者打开以及前保存的结果.右侧显示了所有的日志,可以轻松回到之前的状态,视图的主区域上半部分是数据,下半部分是聚类视图. INTRODUCTION 数据聚类对 ...
【CV论文阅读】Deep Linear Discriminative Analysis, ICLR, 2016
DeepLDA 并不是把LDA模型整合到了Deep Network,而是利用LDA来指导模型的训练.从实验结果来看,使用DeepLDA模型最后投影的特征也是很discriminative 的,但是很遗 ...
论文解读《Deep Attention-guided Graph Clustering with Dual Self-supervision》
论文信息论文标题:Deep Attention-guided Graph Clustering with Dual Self-supervision论文作者:Zhihao Peng, Hui Liu ...
【论文阅读】Deep Clustering for Unsupervised Learning of Visual Features
文章:Deep Clustering for Unsupervised Learning of Visual Features 作者:Mathilde Caron, Piotr Bojanowski, ...
【CV论文阅读】生成式对抗网络GAN
生成式对抗网络GAN 1. 基本GAN 在论文<Generative Adversarial Nets>提出的GAN是最原始的框架,可以看成极大极小博弈的过程,因此称为“对抗网络”.一般 ...

随机推荐

H.264学习笔记3——帧间预测
帧间预测主要包括运动估计(运动搜索方法.运动估计准则.亚像素插值和运动矢量估计)和运动补偿. 对于H.264,是对16x16的亮度块和8x8的色度块进行帧间预测编码. A.树状结构分块 H.264的宏 ...
SQLite busy handler
SQLite doesn't support high concurrency. In case of a lot of concurrent access from multi-process or ...
charsets - 程序员对字符集和国际化的观点
描述 Linux 是一个国际性的操作系统.它的各种各样实用程序和设备驱动程序 (包括控制台驱动程序 ) 支持多种语言的字符集,包括带有附加符号的拉丁字母表字符,重音符,连字(字母结合), 和全部非拉丁 ...
C# 實現文件壓縮-- 背景：服務器Log.txt 過多，佔用過多硬盤空間，壓縮備份后節省空間資源
1.壓縮實現代碼如下: 調用ICSharpCode.SharpZipLib.dll(free software,可以搜到源碼). 轉移指定目錄文件夾轉移到目標文件夾壓縮目標文件夾刪除目標文件夾 u ...
CAD参数绘制线型标注（com接口）
主要用到函数说明: _DMxDrawX::DrawDimRotated 绘制一个线型标注.详细说明如下: 参数说明 DOUBLE dExtLine1PointX 输入第一条界线的起始点X值 DOUB ...
PHP-碎片知识 $_SERVER['argv']
1.cli模式(命令行)下,第一个参数$_SERVER['argv'][0]是脚本名,其余的是传递给脚本的参数 2.web网页模式下在web页模式下必须在php.ini开启register_argc ...
No-4.变量的基本使用
变量的基本使用程序就是用来处理数据的,而变量就是用来存储数据的目标变量定义变量的类型变量的命名 01. 变量定义在 Python 中,每个变量在使用前都必须赋值,变量赋值以后该变量 ...
[转载]C++、C#写的WebService相互调用
[转载]C++.C#写的WebService相互调用首先感谢永和兄提供C++的WebService服务器端及客户端,并且陪我一起熬夜:然后是火石和我做接口的兄弟,虽然都不知道你叫什么,如果没有你 ...
Bootstrap table的基础用法
一.官方文档 Bootstrap 中文网:http://www.bootcss.com/ Bootstrap Table 中文网 : http://bootstrap-table.wenzhixin. ...
java1.8学习-什么样的匿名内部类能被lambda语法代替？
java1.8学习-什么样的匿名内部类能被lambda语法代替? java1.8好多新的特性真的很有意思,特别是Lambda.在学习的时候发现并不是所有的匿名内部类都可以用Lambda代替. lamb ...

【CV论文阅读】Unsupervised deep embedding for clustering analysis

【CV论文阅读】Unsupervised deep embedding for clustering analysis的更多相关文章

随机推荐

热门专题