【CV论文阅读】Deep Linear Discriminative Analysis, ICLR, 2016

DeepLDA 并不是把LDA模型整合到了Deep Network，而是利用LDA来指导模型的训练。从实验结果来看，使用DeepLDA模型最后投影的特征也是很discriminative 的，但是很遗憾没有看到论文是否验证了topmost 的hidden representation 是否也和softmax指导产生的representation一样的discriminative。

DeepLDA和一般的deep network唯一不同是它的loss function。两者对比如下：

对于LDA，优化的目标是最小化类内方差，同时最大化类间方差。由于LDA是一个有监督的模型，对于多分类的情况如个类，则最终投影的一个子空间的维数只有。多分类情况LDA优化的目标公式为，

其中A就是投影矩阵。是between scatter matrix，可以理解为类中心间的方差；而定义为within scatter matrix，可以理解为类内协方差的和。它们的计算公式如下：

这里，我们已经假设所有的样本都是去中心化的了。最后问题变成了一个泛化的特征方程求解的问题，矩阵A对应着相应的特征向量。

事实上，特征向量指示着投影最大方差的方向，特征值则是对特征向量重要程度的一个量化。而论文的一个insight就是，希望可以指导网络生成topmost的representation能够在各个方向都产生较大的特征值，即不希望投影的方向在某个方向更方差会更大，因为这代表了信息量的多少。论文提出一种直接把特征值作为loss function的方法，因为训练的时候，网络倾向于优化最大的特征值，产生一个trivial的结果，即使得大的特征值会倾向于更大而牺牲其他小的特征值。因此论文定义loss function在小的特征值上：

特征值的求解是建立在topmost的representation的基础上的。模型的训练使用mini-batch的随机梯度下降法，而特征值可以直接对representation 进行求导：

论文的appendix可以看到完整的求导过程。

最后，论文的实验室通过对project后的特征进行分类，所以比较的是分类的精度，以及test error。而且，实验的结果还挺competitive的。

【CV论文阅读】Deep Linear Discriminative Analysis, ICLR, 2016的更多相关文章

【CV论文阅读】Unsupervised deep embedding for clustering analysis
Unsupervised deep embedding for clustering analysis 偶然发现这篇发在ICML2016的论文,它主要的关注点在于unsupervised deep e ...
【CV论文阅读】+【搬运工】LocNet: Improving Localization Accuracy for Object Detection + A Theoretical analysis of feature pooling in Visual Recognition
论文的关注点在于如何提高bounding box的定位,使用的是概率的预测形式,模型的基础是region proposal.论文提出一个locNet的深度网络,不在依赖于回归方程.论文中提到locne ...
【CV论文阅读】生成式对抗网络GAN
生成式对抗网络GAN 1. 基本GAN 在论文<Generative Adversarial Nets>提出的GAN是最原始的框架,可以看成极大极小博弈的过程,因此称为“对抗网络”.一般 ...
[论文阅读] Deep Residual Learning for Image Recognition(ResNet)
ResNet网络,本文获得2016 CVPR best paper,获得了ILSVRC2015的分类任务第一名. 本篇文章解决了深度神经网络中产生的退化问题(degradation problem). ...
【CV论文阅读】Image Captioning 总结
初次接触Captioning的问题,第一印象就是Andrej Karpathy好聪明.主要从他的两篇文章开始入门,<Deep Fragment Embeddings for Bidirectio ...
【CV论文阅读】 Fast RCNN + SGD笔记
Fast RCNN的结构: 先从这幅图解释FAST RCNN的结构.首先,FAST RCNN的输入是包含两部分,image以及region proposal(在论文中叫做region of inter ...
【CV论文阅读】：Rich feature hierarchies for accurate object detection and semantic segmentation
R-CNN总结不总结就没有积累 R-CNN的全称是 Regions with CNN features.它的主要基础是经典的AlexNet,使用AlexNet来提取每个region特征,而不再是传统 ...
【CV论文阅读】Detecting events and key actors in multi-person videos
论文主要介绍一种多人协作的视频事件识别的方法,使用attention模型+RNN网络,最近粗浅地学习了RNN网络,它比较适合用于处理序列的存在上下文作用的数据. NCAA Basketball数据集 ...
【CV论文阅读】Dynamic image networks for action recognition
论文的重点在于后面approximation部分. 在<Rank Pooling>的论文中提到,可以通过训练RankSVM获得参数向量d,来作为视频帧序列的representation.而 ...

随机推荐

Youtube-dl 简短使用总结
默认下载bestvideo+bestaudio,并通过ffmpeg -c copy output.mp4 简单的封装进mp4格式,而不进行转码. 有时候bestaudio 是opus编码的,但是mp4 ...
linux下PPTP Server测试环境搭建
1.1 服务器软件安装安裝PPTP Server 所需的软件: 安装PPTP: sudo apt-get install pptpd PPTP Server的软件安装很简单,只需要安装pptpd ...
sql server 强制关闭连接
USE master; GO DECLARE @SQL VARCHAR(MAX); SET @SQL='' SELECT @SQL=@SQL+'; KILL '+RTRIM(SPID) FROM ma ...
【VBA研究】如何用Base64 编解码方法实现简单的加解密
Base64编码的思想是是采用64个基本的ASCII码字符对数据进行重新编码,将数据变成字符串实现文本传输.由于编码简单,所以很容易实现,代码也是现成的.利用这个编码规则可以实现简单的加解密.编解码方 ...
biff - 新到邮件提醒
总览 (SYNOPSIS) biff [ny ] 描述 (DESCRIPTION) Biff 通知系统在当前终端会话期间有新邮件是否提醒你. 支持的选项有 biff n 禁止新邮件提醒. y 开启新邮 ...
anchor_target_layer层其他部分解读
inds_inside = np.where( (all_anchors[:, 0] >= -self._allowed_border) & (all_anchors[:, 1] > ...
mysql创建中文编码库
[2013/5/27 16:06:08] LuoXingchen: Create MySQL Database with Chinese supported: mysql> cre ...
IDEA、Eclipse快捷键对比
IDEA.Eclipse快捷键对比序号功能 IDEA Eclipse 1 很多功能:导入包,处理异常,强转cast Alt+Enter 2 导入包,自动修正??? Ctrl+Enter 3 ...
升级到Offiec 2016后 Power View 不见了的处理方法
好吧并不是没有了,而只是快捷方式需要手动的调整出来, 过程还是挺复杂,给一个官方文档吧. Turn on Power View in Excel 2016 for Windows https://s ...
Jmeter关联,正则表达式提取器使用1
Jmeter关联,正则表达式提取器使用一.Jmeter关联的方式: Jmeter中关联可以在需要获取数据的请求上右键-->后置处理器选择需要的关联方式,如下图有很多种方法可以提取动态 ...

【CV论文阅读】Deep Linear Discriminative Analysis, ICLR, 2016

【CV论文阅读】Deep Linear Discriminative Analysis, ICLR, 2016的更多相关文章

随机推荐

热门专题