论文笔记之：Heterogeneous Image Features Integration via Multi-Modal Semi-Supervised Learning Model

Heterogeneous Image Features Integration via Multi-Modal Semi-Supervised Learning Model

ICCV 2013

　　本文提出了一种结合多种传统手工设计 feature 的多模态方法，在 label propagation 的基础上进行标签传递，进行半监督学习，综合利用各种 feature 的优势，自适应的对各种feature 的效果进行加权，即：对于判别性较好的 feature给予较高的权重，较差的 feature 给予较低的权重，然后将整个流程融合在一个框架中进行学习。

　　关于基于 Graph 的标签传递的基础知识，请参考具体论文，或者本博客的博文“Dynamic Label Propagation for Semi-supervised Multi-class Multi-label Classification”。

　　下面的公式即为所提出的 general 的 framework：

　　其中，这个公式主要有 3个成分，即：各个feature 所占的权重 $\alpha^{(v)}$，V 是所有feature类别总数，$G^{(v)}$ 是第 v 个特征对应的类别标签矩阵 (class label matrix)，$G$ 是我们所感兴趣的比较趋于一致的类别标签矩阵。通过求解该公式，同时得到 $G^{(v)}$, $G$, $\alpha^{(v)}$。

　　由于该框架并非凸的，那么无法直接对其进行求解，那么我们要做的就是将其拆分为 3个步骤，分别进行求解，即：

　　Step 1: 　　固定 $G^{(v)}$, $G$, 然后先求解 $\alpha^{(v)}$：

　　然后这个子问题，就可以利用拉格朗日乘数法进行求解，因为这是一个带有约束的最小值问题。

　　然后可以求解得到公式（11），即为各个模态的权重，但是蓝色加深字体，可能是作者笔误，我认为这里应该是 $\alpha^{(v)}$才对，因为求得就是这个，不知道为何弄出一个 $a^{(v)}$出来。额。。。

　　Step 2.　　就是固定已经求出的 $\alpha^{(v)}$ 以及 $G$，然后去求解 $G^{(v)}$：

　　将上述问题转换为：

　　可以得到公式（13），即为所求。

　　Step 3. 　　固定已经求出的 $\alpha^{(v)}$ 以及 $G^{(v)}$，然后去求解 $G$：

　　由此可以得到：

　　迭代的进行上述三个步骤，直至收敛。

　　最后一步，就是将所得到的标签向量取最大值，作为对应样本的标签，即：

　　完整的算法流程如下：

　　本文的实验部分，做的比较充分，在 4个数据集上进行了验证。本文所要验证的主要问题就是，这种方式自适应加权的 feature 组合可以得到更好的标签传递效果。

　　感受：

　　今天由于是博主要做实验对比，才去搜索对应的半监督学习论文，然后发现了聂飞平老师的文章，也算是比较老的文章了。我觉得这也给我们做学术的人提供了一个很好的示例，如何做研究。本来 label propagation 是一种经典的算法，那么如何在别人在算法进行修改的基础上，做出自己的东西来，额，这个其实看着是大空话，不过还是很有指导意义的。归纳下本文的贡献点，即：提出一种 general 的半监督学习框架，在传统方法 label propagation 的基础上，引入了多种 feature 的思想，对各个feature 的性能进行加权处理，当然求解方法也是经常使用的拆分成子问题的方法来做。

　　本文给出了算法的主要 code，但是各种 feature 的提取真是蛋疼，我找了半天才找到一个工具包，但是还是不够全面，因为文中涉及到多种feature的提取，我觉得作者最好还是将 feature的提取工具放出来比较好，这样别人在引用您的文章时，也可以很不费劲的进行实验，然后对比。额。。。

　　不说了，我去提 feature了。。。

　　拜拜。。。

论文笔记之：Heterogeneous Image Features Integration via Multi-Modal Semi-Supervised Learning Model的更多相关文章

论文笔记之：Action-Decision Networks for Visual Tracking with Deep Reinforcement Learning
论文笔记之:Action-Decision Networks for Visual Tracking with Deep Reinforcement Learning 2017-06-06 21: ...
论文笔记：Heterogeneous Memory Enhanced Multimodal Attention Model for Video Question Answering
Heterogeneous Memory Enhanced Multimodal Attention Model for Video Question Answering 2019-04-25 21: ...
论文笔记：Cross-Domain Visual Matching via Generalized Similarity Measure and Feature Learning
Cross-Domain Visual Matching,即跨域视觉匹配.所谓跨域,指的是数据的分布不一样,简单点说,就是两种数据「看起来」不像.如下图中,(a)一般的正面照片和各种背景角度下拍摄的照 ...
论文笔记：多标签学习综述（A review on multi-label learning algorithms）
2014 TKDE(IEEE Transactions on Knowledge and Data Engineering) 张敏灵,周志华简单介绍传统监督学习主要是单标签学习,而现实生活中目标样 ...
论文笔记 - GRAD-MATCH: A Gradient Matching Based Data Subset Selection For Efficient Learning
Analysis Coreset 是带有权重的数据子集,目的是在某个方面模拟完整数据的表现(例如损失函数的梯度,既可以是在训练数据上的损失,也可以是在验证数据上的损失): 给出优化目标的定义: $w^ ...
论文笔记之：Visual Tracking with Fully Convolutional Networks
论文笔记之:Visual Tracking with Fully Convolutional Networks ICCV 2015 CUHK 本文利用 FCN 来做跟踪问题,但开篇就提到并非将其看做 ...
Twitter 新一代流处理利器——Heron 论文笔记之Heron架构
Twitter 新一代流处理利器--Heron 论文笔记之Heron架构标签(空格分隔): Streaming-process realtime-process Heron Architecture ...
论文笔记之：Natural Language Object Retrieval
论文笔记之:Natural Language Object Retrieval 2017-07-10 16:50:43 本文旨在通过给定的文本描述,在图像中去实现物体的定位和识别.大致流程图如下 ...
Deep Reinforcement Learning for Visual Object Tracking in Videos 论文笔记
Deep Reinforcement Learning for Visual Object Tracking in Videos 论文笔记 arXiv 摘要:本文提出了一种 DRL 算法进行单目标跟踪 ...

随机推荐

新版的tomcat里面get请求通过http协议的时候似乎默认是UTF-8的编码了吗？
不在servler.xml的connector中添加URICoding=“UTF-8”,使用默认值一样没有乱码,而添加URICoding=“iso-8859-1”就是乱码了. POST请求还是用iso ...
linux学习笔记2：linux 下java开发的软件安装
一.java ee开发环境的搭建 1.jdk的安装步骤 (1)首先必须要有安装文件,具体的可以去相关网站上下载,并制作iso文件 (2)将制作的iso文件挂载到linux系统上,并在虚拟机上将iso文 ...
ulink 固件更新问题
1前言 ulink版本升级.. 当使用keil4.7.4版本时,ulink固件库更新了. 2官方资料解释: Boot Mode Utility Home » Appendix » Utilities ...
C#语法问答式总结
传入某个属性的set方法的隐含参数的名称是什么?value,它的类型和属性所声名的类型相同. 如何在C#中实现继承?在类名后加上一个冒号,再加上基类的名称. C#支持多重继承么?不支持.可以用接口来实 ...
全球著名的渗透测试Linux简介
注:如发现链接无法打开,请尝试代理登录链接 1. Kali Linux Kali Linux是基于Debian的Linux发行版, 设计用于数字取证和渗透测试.由Offensive Security ...
linux常用命令:1文件处理命令
文件处理命令 1.命令格式命令格式:命令 [-选项] [参数] 例:ls -la /etc 说明:1)个别命令使用不遵循此格式 2)档有多个选项时,可以写在一起 3)简化选项与完整选项 2.目录 ...
SQUID之cache_peer
一共关系到cache_peer/always_direct/never_direct/hierarchy_stoplist/prefer_direct等配置项. squid的使用指南上,关于alway ...
nno_setup制作升级包必须面临的几个问题 2
这两天的时间一直在制作应用程序的升级包,期间碰到一些问题这里一并记录下来,相信这是制作升级包必须面临和解决的问题: 1. 升级包安装程序如何不再产生新的安装.卸载程序 Inno_setup中AppId ...
Gmail邮箱添加域名解析
主机记录 MX 服务器地址优先级@ MX ASPMX.L.GOOGLE.COM. 10@ MX ALT1.ASPMX.L.GOOGLE.COM. 20@ MX ALT2.AS ...
busybox reboot 无效
/*********************************************************************** * busybox reboot 无效 * 说明: * ...

论文笔记之：Heterogeneous Image Features Integration via Multi-Modal Semi-Supervised Learning Model

论文笔记之：Heterogeneous Image Features Integration via Multi-Modal Semi-Supervised Learning Model的更多相关文章

随机推荐

热门专题