Heterogeneous Image Features Integration via Multi-Modal Semi-Supervised Learning Model

ICCV 2013

  

  本文提出了一种结合多种传统手工设计 feature 的多模态方法,在 label propagation 的基础上进行标签传递,进行半监督学习,综合利用各种 feature 的优势,自适应的对各种feature 的效果进行加权,即:对于判别性较好的 feature给予较高的权重,较差的 feature 给予较低的权重,然后将整个流程融合在一个框架中进行学习。

    关于基于 Graph 的标签传递的基础知识,请参考具体论文,或者本博客的博文“Dynamic Label Propagation for Semi-supervised Multi-class Multi-label Classification”。

     下面的公式即为所提出的 general 的 framework:

  其中,这个公式主要有 3个成分,即:各个feature 所占的权重 $\alpha^{(v)}$,V 是所有feature类别总数,$G^{(v)}$ 是第 v 个特征对应的类别标签矩阵 (class label matrix),$G$ 是我们所感兴趣的 比较趋于一致的 类别标签矩阵。通过求解该公式,同时得到 $G^{(v)}$, $G$, $\alpha^{(v)}$。

  由于该框架并非凸的,那么无法直接对其进行求解,那么我们要做的就是将其拆分为 3个 步骤,分别进行求解,即:

  Step 1:   固定 $G^{(v)}$, $G$, 然后先求解 $\alpha^{(v)}$:

  然后这个子问题,就可以利用拉格朗日乘数法进行求解,因为这是一个带有约束的最小值问题。

  然后可以求解得到公式(11),即为各个模态的权重,但是 蓝色加深字体,可能是作者笔误,我认为这里应该是 $\alpha^{(v)}$才对,因为求得就是这个,不知道为何弄出一个 $a^{(v)}$出来。额。。。

  

  Step 2.  就是固定已经求出的 $\alpha^{(v)}$ 以及 $G$,然后去求解 $G^{(v)}$:

  将上述问题转换为:

  可以得到公式(13),即为所求。

  Step 3.   固定已经求出的 $\alpha^{(v)}$ 以及  $G^{(v)}$,然后去求解 $G$:

  由此可以得到:

  迭代的进行上述三个步骤,直至收敛。

  最后一步,就是将所得到的标签向量取最大值,作为对应样本的标签,即:

  

  完整的算法流程如下:

  本文的实验部分,做的比较充分,在 4个数据集上进行了验证。本文所要验证的主要问题就是,这种方式自适应加权的 feature 组合可以得到更好的标签传递效果。


  感受:

  今天由于是博主要做实验对比,才去搜索对应的半监督学习论文,然后发现了聂飞平老师的文章,也算是比较老的文章了。我觉得这也给我们做学术的人提供了一个很好的示例,如何做研究。本来 label propagation 是一种经典的算法,那么如何在别人在算法进行修改的基础上,做出自己的东西来,额,这个其实看着是大空话,不过还是很有指导意义的。归纳下本文的贡献点,即:提出一种 general 的半监督学习框架,在传统方法 label propagation 的基础上,引入了多种 feature 的思想,对各个feature 的性能进行加权处理,当然求解方法也是经常使用的拆分成子问题的方法来做。

  本文给出了 算法的主要 code,但是各种 feature 的提取真是蛋疼,我找了半天才找到一个工具包,但是还是不够全面,因为文中涉及到多种feature的提取,我觉得作者最好还是将 feature的提取工具放出来比较好,这样别人在引用您的文章时,也可以很不费劲的进行实验,然后对比。额。。。

  不说了,我去提 feature了 。。。

  拜拜 。。。

  

  

论文笔记之:Heterogeneous Image Features Integration via Multi-Modal Semi-Supervised Learning Model的更多相关文章

  1. 论文笔记之:Action-Decision Networks for Visual Tracking with Deep Reinforcement Learning

    论文笔记之:Action-Decision Networks for Visual Tracking with Deep Reinforcement Learning  2017-06-06  21: ...

  2. 论文笔记:Heterogeneous Memory Enhanced Multimodal Attention Model for Video Question Answering

    Heterogeneous Memory Enhanced Multimodal Attention Model for Video Question Answering 2019-04-25 21: ...

  3. 论文笔记:Cross-Domain Visual Matching via Generalized Similarity Measure and Feature Learning

    Cross-Domain Visual Matching,即跨域视觉匹配.所谓跨域,指的是数据的分布不一样,简单点说,就是两种数据「看起来」不像.如下图中,(a)一般的正面照片和各种背景角度下拍摄的照 ...

  4. 论文笔记:多标签学习综述(A review on multi-label learning algorithms)

    2014 TKDE(IEEE Transactions on Knowledge and Data Engineering) 张敏灵,周志华 简单介绍 传统监督学习主要是单标签学习,而现实生活中目标样 ...

  5. 论文笔记 - GRAD-MATCH: A Gradient Matching Based Data Subset Selection For Efficient Learning

    Analysis Coreset 是带有权重的数据子集,目的是在某个方面模拟完整数据的表现(例如损失函数的梯度,既可以是在训练数据上的损失,也可以是在验证数据上的损失): 给出优化目标的定义: $w^ ...

  6. 论文笔记之:Visual Tracking with Fully Convolutional Networks

    论文笔记之:Visual Tracking with Fully Convolutional Networks ICCV 2015  CUHK 本文利用 FCN 来做跟踪问题,但开篇就提到并非将其看做 ...

  7. Twitter 新一代流处理利器——Heron 论文笔记之Heron架构

    Twitter 新一代流处理利器--Heron 论文笔记之Heron架构 标签(空格分隔): Streaming-process realtime-process Heron Architecture ...

  8. 论文笔记之:Natural Language Object Retrieval

    论文笔记之:Natural Language Object Retrieval 2017-07-10  16:50:43   本文旨在通过给定的文本描述,在图像中去实现物体的定位和识别.大致流程图如下 ...

  9. Deep Reinforcement Learning for Visual Object Tracking in Videos 论文笔记

    Deep Reinforcement Learning for Visual Object Tracking in Videos 论文笔记 arXiv 摘要:本文提出了一种 DRL 算法进行单目标跟踪 ...

随机推荐

  1. 新版的tomcat里面get请求通过http协议的时候似乎默认是UTF-8的编码了吗?

    不在servler.xml的connector中添加URICoding=“UTF-8”,使用默认值一样没有乱码,而添加URICoding=“iso-8859-1”就是乱码了. POST请求还是用iso ...

  2. linux学习笔记2:linux 下java开发的软件安装

    一.java ee开发环境的搭建 1.jdk的安装步骤 (1)首先必须要有安装文件,具体的可以去相关网站上下载,并制作iso文件 (2)将制作的iso文件挂载到linux系统上,并在虚拟机上将iso文 ...

  3. ulink 固件更新问题

    1前言 ulink版本升级.. 当使用keil4.7.4版本时,ulink固件库更新了. 2官方资料解释: Boot Mode Utility Home » Appendix » Utilities  ...

  4. C#语法问答式总结

    传入某个属性的set方法的隐含参数的名称是什么?value,它的类型和属性所声名的类型相同. 如何在C#中实现继承?在类名后加上一个冒号,再加上基类的名称. C#支持多重继承么?不支持.可以用接口来实 ...

  5. 全球著名的渗透测试Linux简介

    注:如发现链接无法打开,请尝试代理登录链接 1. Kali Linux Kali Linux是基于Debian的Linux发行版, 设计用于数字取证和渗透测试.由Offensive Security ...

  6. linux常用命令:1文件处理命令

    文件处理命令 1.命令格式 命令格式:命令 [-选项]  [参数] 例:ls  -la /etc 说明:1)个别命令使用不遵循此格式 2)档有多个选项时,可以写在一起 3)简化选项与完整选项 2.目录 ...

  7. SQUID之cache_peer

    一共关系到cache_peer/always_direct/never_direct/hierarchy_stoplist/prefer_direct等配置项. squid的使用指南上,关于alway ...

  8. nno_setup制作升级包必须面临的几个问题 2

    这两天的时间一直在制作应用程序的升级包,期间碰到一些问题这里一并记录下来,相信这是制作升级包必须面临和解决的问题: 1. 升级包安装程序如何不再产生新的安装.卸载程序 Inno_setup中AppId ...

  9. Gmail邮箱添加域名解析

    主机记录  MX   服务器地址 优先级@  MX   ASPMX.L.GOOGLE.COM. 10@  MX   ALT1.ASPMX.L.GOOGLE.COM. 20@  MX   ALT2.AS ...

  10. busybox reboot 无效

    /*********************************************************************** * busybox reboot 无效 * 说明: * ...