Sequential projection learning for hashing阅读笔记

真不能再挖坑了，前面挖聊很多坑都没来得及填，从今往后，能写多少就是多少。Sequential projection learning for hashing这篇文章去年就阅读了，当时阅读完没来得及做笔记，这一段时间又重新拿来品读了一年天，并对其中的公式进行了推导，这篇文章作者主页上有slide，讲得挺好的。下面是自己的一些推导，由于公式编辑起来不急手写得快，所以就用笔记代替了。

这里标号为1推导的是paper目标函数项中的第一项，目标函数第二项是通过最大化信息熵而来的，关于到最后为神马转化为了求信息熵最大化，仍本小子一一道来。

有了第一项，还远远不够，因为第一项只保持能够在带标记的样本上获得很高的准确率，当不能保证在未标记的样本上也能获得较高的准确率，也就是过拟合问题，即在训练样本上performance很well,但是在测试样本上很bad。所以为了避免出现这个问题，作者对spectral hashing中要求的编码位求和相加得为0进行了分析与证明，最后得出要要求编码位求和相加为0就是要求信息熵最大。paper中的一个图很好的说明了上面这个情况：

为便于理解，假设上面就是简单的二维平面，在左图中，虽然对于带标记的样本，其编码位（这里只有一位）相加求和为0，但对于未标记的样本，其编码位相加求和显然不会等于0，而且，可以看到，落入分类面右边的可能性要远比左边的要大；而对于右图，其划分相比比较均匀，不仅满足了标记样本的要求，而且也满足了非标记样本的要求（编码位求和相加为0），而且，大概的示意出了落入两边的概率为50%。由此，对于右图，其包含的信息熵相比与左图，要更大。用一句话概括上面第二项为神马要进行这样的约束，其实就是要求编码位求和相加为0，并经过转换，化为信息熵最大的约束。

再回到上面手写笔记那幅图，标号2对应位置有关于S更新过程的推导，推导过程还算简单，对其求微分便可。本小子不太理解的地方还是这个S更新过程的物理意义。

Reference:

1:Sequential Projection Learning for Hashing with Compact Codes

from: http://yongyuan.name/blog/sequential-projection-learning-for-hashing.html

Sequential projection learning for hashing阅读笔记的更多相关文章

Who Am I? Personality Detection based on Deep Learning for Texts 阅读笔记
文章目录源代码github地址摘要 2CLSTM 过程 1. 词嵌入 2. 2LSTM处理 3. CNN学习LSGCNN学习LSG 4. Softmax分类源代码github地址 https:/ ...
个性探测综述阅读笔记——Recent trends in deep learning based personality detection
目录 abstract 1. introduction 1.1 个性衡量方法 1.2 应用前景 1.3 伦理道德 2. Related works 3. Baseline methods 3.1 文本 ...
阅读《LEARNING HARD C#学习笔记》知识点总结与摘要系列文章索引
从发表第一篇文章到最后一篇文章,时间间隔有整整一个月,虽只有5篇文章,但每一篇文章都是我吸收<LEARNING HARD C#学习笔记>这本书的内容要点及网上各位大牛们的经验,没有半点废话 ...
阅读《LEARNING HARD C#学习笔记》知识点总结与摘要三
最近工作较忙,手上有几个项目等着我独立开发设计,所以平时工作日的时候没有太多时间,下班累了就不想动,也就周末有点时间,今天我花了一个下午的时间来继续总结与整理书中要点,在整理的过程中,发现了书中的一些 ...
阅读《LEARNING HARD C#学习笔记》知识点总结与摘要二
今天继续分享我的阅读<LEARNING HARD C#学习笔记>知识点总结与摘要二,仍然是基础知识,但可温故而知新. 七．面向对象三大基本特性: 封装:把客观事物封装成类,并隐藏类的内部 ...
阅读《LEARNING HARD C#学习笔记》知识点总结与摘要一
本人有幸在Learning Hard举行的整点抢书活动<Learninghard C#学习笔记>回馈网友,免费送书5本中免费获得了一本<LEARNING HARD C#学习笔记> ...
论文阅读笔记 Improved Word Representation Learning with Sememes
论文阅读笔记 Improved Word Representation Learning with Sememes 一句话概括本文工作使用词汇资源--知网--来提升词嵌入的表征能力,并提出了三种基于 ...
Deep Learning of Graph Matching 阅读笔记
Deep Learning of Graph Matching 阅读笔记 CVPR2018的一篇文章,主要提出了一种利用深度神经网络实现端到端图匹配(Graph Matching)的方法. 该篇文章理 ...
【转载】《Human-level concept learning through probabilistic program induction》阅读笔记
原文地址: https://blog.csdn.net/ln1996/article/details/78459060 --------------------- 作者:lnn_csdn 来源:CSD ...

随机推荐

【LOJ】#2037. 「SHOI2015」脑洞治疗仪
题解维护区间内1的个数,左边数0的长度,右边数0的长度,区间内0区间最长个数,覆盖标记第一种操作区间覆盖0 第二种操作查询\([l_0,r_0]\)中1的个数,区间覆盖0,然后覆盖时找到相对应的区 ...
000 Excel获取数据
1.目标网址 http://data.10jqka.com.cn/funds/ggzjl/field/zjjlr 二:需求一 1.需求爬单个页面的数据 2.变化网址 http://data.10jq ...
hdoj1863 畅通工程（Prime || Kruskal）
题目链接 http://acm.hdu.edu.cn/showproblem.php?pid=1863 思路最小生成树问题,使用Prime算法或者Kruskal算法解决.这题在hdoj1233的基础 ...
poj1979 Red And Black(DFS)
题目链接 http://poj.org/problem?id=1979 思路 floodfill问题,使用dfs解决代码 #include <iostream> #include < ...
镣铐之舞：美团安全工程师Black Hat USA演讲
背景 2018年8月9日,全球顶级安全会议——Black Hat USA在美国拉斯维加斯的曼德勒海湾会议中心落下了帷幕,这场盛会在全球黑客心中几乎等同于“世界杯”和“奥斯卡”一样的存在.这场一年一度的 ...
date time insert
DATE=`date '+%m/%d/%Y'`TIME=`date '+%H:%M:%S'` sed -i '1i1***** start*****' test.kshsed -i '2i\ REPO ...
算法转AI平台工程师记录-0
--- vim源码安装: 1. git clone https://github.com/vim/vim.git 2. cd vim && ./configure --prefix=x ...
bzoj 3926
后缀自动机扩展到树形结构上. 先建出大的Trie,然后我们得到了一棵Trie树,对于树上的每个节点,保存一个后缀自动机从根走它代表的字符串后到达的节点,每次其儿子就从父亲的这个节点开始扩展. /*** ...
bzoj 4237: 稻草人 -- CDQ分治
4237: 稻草人 Time Limit: 40 Sec Memory Limit: 256 MB Description JOI村有一片荒地,上面竖着N个稻草人,村民们每年多次在稻草人们的周围举行 ...
Codeforces Round #351 (VK Cup 2016 Round 3, Div. 2 Edition) B. Problems for Round 水题
B. Problems for Round 题目连接: http://www.codeforces.com/contest/673/problem/B Description There are n ...

Sequential projection learning for hashing阅读笔记

Sequential projection learning for hashing阅读笔记的更多相关文章

随机推荐

热门专题