Learning Discriminative Features with Class Encoder

近来论文看了许多，但没多少时间总结下来。今天暂时记录一篇比较旧的论文，选择理由是 Discriminative features。

做图像说白了就是希望有足够有判别性的特征，这样在分类或者匹配、检索的时候才能有较好的精度。

一. 综述

这篇论文思想很简单。如何称之为有判别性的特征？作者利用编码器的思想，对于同一ID的图形的特征，如果编码后仍可以较好的解码为同一ID的特征，那么我们就说这个特征有判别力。这里有个点值得注意：编码器是针对图像特征，非图像本身。好的特征表示大概有2个衡量标准：可以很好的重构出输入数据、对输入数据一定程度下的扰动具有不变性。普通的autoencoder、sparse autoencoder、stacked autoencoder则主要符合第一个标准，而deniose autoencoder和contractive autoencoder则主要体现在第二个。在一些分类任务中，第二个标准显得更加重要。

二. 摘要

编码器一般用在非监督领域，这里将编码器加在监督学习里，为了学得的特征有好的判别性。这里利用编解码器来重建同一label的个体的特征。这样做是为了最小化类内方差。

三. 介绍

有许多重建模型算法：DAE（denoising auto-encoder）、CAE（contractive auto-encoder）。但这些算法都是在非监督领域，为了获得更有判别性的特征还得是监督学习。所以作者将编码器思想与监督学习（softmax传统监督分类）结合到了一起。此外作者指出AE对于图像变换不够鲁棒。传统AE限于小图、对齐的简单图像。作者提出class-encoder作为softmax classifier的一个限制项（辅助），从而优于纯softmax。

结构如下：

x为输入数据（特征），h为隐层，xhat为重构（同一label的特征）。那么最小化重构损失即可：

所以整体模型即为两支路：利用编码器优化特征、利用softmax分类：

同样，作者验证隐层一层就够好，但是隐层神经元数目不同结果也不同：

最终实验验证了加上编码器的softmax要优于纯softmax。有个点是：作者采取了一层卷积和两层局部连接层 two locally-connected layers,类似于卷积，但是层间不共享参数。因此它适用于提取一组有规律的图像：例如人脸。

四. 结论

该模型只用到了类内的对，也就是正样本对，没有用到任何不匹配对。而其他算法（DeepID2）同时利用了正负对，这说明负对的贡献在训练中是比较小的。类内重建是有助于学习鲁棒、有判别性的特征。在特征层面上的策略很好解决了FC net的上的尺寸以及变换问题。

附：特征向量feature embedding：每列为同一ID：

Learning Discriminative Features with Class Encoder的更多相关文章

Paper-[arXiv 1710.03144]Island Loss for Learning Discriminative Features in Facial Expression
[arXiv 1710.03144]Island Loss for Learning Discriminative Features in Facial Expression ABSTRACT 作者在 ...
Machine Learning : Pre-processing features
from:http://analyticsbot.ml/2016/10/machine-learning-pre-processing-features/ Machine Learning : Pre ...
【DeepLearning】Exercise:Learning color features with Sparse Autoencoders
Exercise:Learning color features with Sparse Autoencoders 习题链接:Exercise:Learning color features with ...
【Discriminative Localization】Learning Deep Features for Discriminative Localization 论文解析（转）
文章翻译: 翻译以下文章来源: 链接
Wasserstein CNN: Learning Invariant Features for NIR-VIS Face Recognition
承接上上篇博客,在其基础上,加入了Wasserstein distance和correlation prior .其他相关工作.网络细节(maxout operator).训练方式和数据处理等基本和前 ...
Learning Phrase Representations using RNN Encoder–Decoder for Statistical Machine Translation
1.主要完成的任务是能够将英文转译为法文,使用了一个encoder-decoder模型,在encoder的RNN模型中是将序列转化为一个向量.在decoder中是将向量转化为输出序列,使用encode ...
论文笔记：Learning Region Features for Object Detection
中心思想继Relation Network实现可学习的nms之后,MSRA的大佬们觉得目标检测器依然不够fully learnable,这篇文章类似之前的Deformable ROI Pooling ...
Learning Rich Features from RGB-D Images for Object Detection and Segmentation论文笔记
相关工作: 将R-CNN推广到RGB-D图像,引入一种新的编码方式来捕获图像中像素的地心姿态,并且这种新的编码方式比单纯使用深度通道有了明显的改进. 我们建议在每个像素上用三个通道编码深度图像:水平视 ...
Learning Discriminative and Transformation Covariant Local Feature Detectors实验环境搭建详细过程
依赖项: Python 3.4.3 tensorflow>1.0.0, tqdm, cv2, exifread, skimage, glob 1.安装tensorflow:https://www ...

随机推荐

SqlAlchenmy基本使用
#简单查询 print(session.query(User).all()) print(session.query(User.name, User.fullname).all()) print(se ...
python字典练习题
python字典练习题写代码:有如下字典按照要求实现每一个功能dict = {"k1":"v1","k2":"v2", ...
GitHub合并（merge）代码时冲突解决
1.手动merge-->消除冲突-->然后commit,push 2.每次合并代码之前需要从远程主分支上拉取代码, 3.使用git命令行解决冲突. 新手可参考一些博客https://www ...
python静态方法和类方法
静态方法和类方法在python2.2中被引用,经典类和新式类都可以使用.同时,一对内建函数:staticmethod和classmethod被引入,用来转化类中某一方法为这两种方法之一. 静态方法: ...
【.net】The source was not found, but some or all event logs could not be searched
1.案发现场: 注册服务的时候 2.解决方案: 用管理员身份运行CMD,再注册服务: I had to run Command Prompt with Administrator Rights.
zookeeper安装（集群）
Dubbo 建议使用Zookeeper 作为服务的注册中心.Zookeeper 集群中只要有过半的节点是正常的情况下,那么整个集群对外就是可用的.正是基于这个特性,要将ZK 集群的节点数量要为奇数(2 ...
2016vijos 1-2 股神小L（堆)
维护前i天的最优解,那么在后面可能会对前面几天的买卖情况进行调整如果前面买入,买入的这个在后面一定不会卖出如果前面卖出,卖出的这个可能会在后面变成买入,因为买这个,卖后面的会获得更多的收益用一个 ...
HTML第一耍标题段落字体等标签
1.HTML标题的使用 <!doctype html> <html> <head> <title>文本标签演示</title> </h ...
伪触发 input file 的click事件
前端在做 input file 美化的时候,通常把 input 定位position 到已美化的按钮最上方 opacity: 0 HTML5时代,已有更方便的方法,点击美化按钮直接触发选择文件事件 ...
数据结构Java实现02----单向链表的插入和删除
文本主要内容: 链表结构单链表代码实现单链表的效率分析一.链表结构: (物理存储结构上不连续,逻辑上连续:大小不固定) 概念: 链式存储结构是基于指针实现的.我们把一个数据 ...

Learning Discriminative Features with Class Encoder

Learning Discriminative Features with Class Encoder的更多相关文章

随机推荐

热门专题