发表于2015年5月PAMI

作者:

Kota Yamaguchi,

M.Hadi Kiapour,

Luis E. Ortiz,

Tamara L. Berg

相关工作:

【服装检索Clothing Retrieval】越来越多的人对clothing recognition problem增加兴趣,Automatic clothing recognition methods可以推动natural and semantic image search,这反映在论文3,4,5,6,7,8中:越来越多有关clothing recognition for retrieval or recommendation applications的论文出现。

其中论文【3】提出一个street-to-shop应用:想要根据现实生活照片从网店中匹配服装图片。使用稀疏编码的transfer matrix进行mapping(street image / shopping image),防止不同的two distribution差异对检索结果造成影响。论文【5】采用类似的cross-scenario检索方法,实例化一个服装解析器显式表现每个衣物件。论文【8】关注的是同一个问题,但是更在意mobile scenarios的效率问题。除了直接关注clothing retrieval的应用外,还有服装外观相似度的应用,如在视频集中找到同一个人【9】。除了与服装相关的应用增长,与服装相关的数据集也越来越多【1】【10】【11】。为了推动应用的发展,我们需要改进图片中衣服的识别准确度,方法之一就是clothing parsing:其目的是对一个人的每个像素给出一个语义标记,如衬衫、裤子、鞋子。本论文的目标就是提供一种clothing parsing方法,可以被有效的运用于很多服装应用中。

【属性识别Attribute Recognition】一般来说,属性和物体的显式特点相关,如:颜色、图案或者形状。对于衣服属性的研究有论文6,12,13,14,15。通常,属性分析建立在检测和定位衣服件或者衣服部位。衣服属性识别这个想法源于论文【16】,该文主要专注于上半身衣服识别。近来Berg等人【12】则提出使用text description自动发现属性并定位。Bossard等人【15】提供了一种从含噪音的Web图像中获取attribute classification的方法。Bourdev等人【13】提出的使用poselets、discriminative image patches(可以捕获图片中小的视觉图案)去检测衣服属性,如“戴着帽子”。因为属性通常不会孤立存在,Chen等人【14】使用CRF考虑属性间的co-occurrence。衣服属性识别的一个应用是retrieval scenarios。使用细粒度(fine-grained)属性检测器或者human-in-the-loop方法交互式的减少搜索结果,找到什么是用户搜索的或者建立用户搜索的具体目标模型。

【衣服或者人体确定】clothing recognition的一个重要应用就是person identification。论文有【19】【20】【21】【22】【23】【24】。

【服装解析clothing parsing】服装解析是一个相对比较新的话题,但是对于解决以上提出的应用、找到有效的服装表示(clothing representations)具有很重要的作用。衣服表示相关的论文【30】将衣服语法上建模成sketch templates。别的论文采用子空间的方法,描述衣服变形(clothing deformations)或者可变空间先验值(deformable spatial priors)【33】。这些方法主要专注于how to model shape deformations用于衣服识别,与他们不同,我们则采用clothing parsing。

继承上一篇论文《Parsing clothing in fashion photographs - 2012》阐述clothing parsing:形式化为一个使用CRF的超像素标记MAP估计,该方法主要亮点就是使用姿态估计用于clothing parsing。Dong等人之后提出将clothing parsing视为一个关于parselets的推理问题:一组最基础的图像块(image region)组成衣服原件(clothing items)【34】。Liu等人提出一个方法:在训练中消除像素级的指导而使用图像级的颜色标签【35】。

本文不同之处在于:1)在没有任何关于图片的先验信息的情况下,识别细粒度的衣服类别。2)本方法不依赖任何over-segmentation,克服了假设超像素均匀分布的限制。3)本方法利用了在关注时装的社会网络中的大量免费的、弱标记的网络图片。

【论文阅读】Retrieving Similar Similar Styles to Parse Clothing(相关工作)的更多相关文章

  1. 论文阅读笔记 Word Embeddings A Survey

    论文阅读笔记 Word Embeddings A Survey 收获 Word Embedding 的定义 dense, distributed, fixed-length word vectors, ...

  2. 论文阅读 | Universal Adversarial Triggers for Attacking and Analyzing NLP

    [code] [blog] 主要思想和贡献 以前,NLP中的对抗攻击一般都是针对特定输入的,那么他们对任意的输入是否有效呢? 本文搜索通用的对抗性触发器:与输入无关的令牌序列,当连接到来自数据集的任何 ...

  3. Bigtable 论文 阅读笔记 - 原理部分

    不支持markdown,桑心.更好的阅读体验请看:Github/Bigtable.md Paper: Google Bigtable paper Notes author: Lhfcws Wu Tim ...

  4. 论文阅读(Xiang Bai——【PAMI2017】An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application to Scene Text Recognition)

    白翔的CRNN论文阅读 1.  论文题目 Xiang Bai--[PAMI2017]An End-to-End Trainable Neural Network for Image-based Seq ...

  5. BITED数学建模七日谈之三:怎样进行论文阅读

    前两天,我和大家谈了如何阅读教材和备战数模比赛应该积累的内容,本文进入到数学建模七日谈第三天:怎样进行论文阅读. 大家也许看过大量的数学模型的书籍,学过很多相关的课程,但是若没有真刀真枪地看过论文,进 ...

  6. 【论文阅读】Parsing Clothing in Fashion Photographs(翻译与理解)

    发表于2012年 作者:Kota Yamaguchi M.Hadi Kiapour Luis E.Ortiz Tamara L.Berg 摘要:展示了一个从时装图片中解析衣服的有效方法,提供了一个一般 ...

  7. 论文阅读笔记 - YARN : Architecture of Next Generation Apache Hadoop MapReduceFramework

    作者:刘旭晖 Raymond 转载请注明出处 Email:colorant at 163.com BLOG:http://blog.csdn.net/colorant/ 更多论文阅读笔记 http:/ ...

  8. 论文阅读笔记 - Mesos: A Platform for Fine-Grained ResourceSharing in the Data Center

    作者:刘旭晖 Raymond 转载请注明出处 Email:colorant at 163.com BLOG:http://blog.csdn.net/colorant/ 更多论文阅读笔记 http:/ ...

  9. Deep Reinforcement Learning for Dialogue Generation 论文阅读

    本文来自李纪为博士的论文 Deep Reinforcement Learning for Dialogue Generation. 1,概述 当前在闲聊机器人中的主要技术框架都是seq2seq模型.但 ...

随机推荐

  1. android sdk Manager path

  2. linux文件系统操作——底层文件访问

        在不使用标准I/O的情况下,使用write,read,open实现对文件的复制操作,这些调用都是直接使用底层系统调用,完成从用户代码到内核代码的切换,消耗大量的系统资源,今天对此进行研究主要是 ...

  3. Linux C 实现Ping功能的程序.

    ping命令是用来查看网络上另一个主机系统的网络连接是否正常的一个工具.ping命令的工作原理是:向网络上的另一个主机系统发送ICMP报文,如果指定系统得到了报文,它将把报文一模一样地传回给发送者,这 ...

  4. 安装VMware vSphere 的目的就是在一台物理服务器上安装很多很多的虚拟机

    版权声明:本文为博主原创文章,未经博主允许不得转载. 我们安装VMware vSphere 的目的就是在一台物理服务器上安装很多很多的虚拟机,我们可以通过VMware vSphere Client直接 ...

  5. js大小写锁判断

    <html> <head> <title>CapsLock Demo</title> <script src="http://ajax. ...

  6. [转载]Android 知识图谱

    from: http://blog.csdn.net/xyz_lmn/article/details/41411355

  7. 分析php获取客户端ip

    用php能获取客户端ip,这个大家都知道,代码如下: /** * 获取客户端ip * @param number $type * @return string */ function getClien ...

  8. BZOJ 1261: [SCOI2006]zh_tree( 区间dp )

    dp(l, r)表示[l, r]这段作为一棵树的最小访问代价. 对于dp(l, r), 我们枚举它的根x, 则dp(l, r) = min(dp(l, x-1)+dp(x+1, r)+C*fx) + ...

  9. 设计模式值六大原则——依赖倒置原则 (DIP)

    依赖倒置原则(Dependence Inversion Principle,DIP)的原始定义: 高层模块不应该依赖底层模块,两者都应该依赖其抽象: 抽象不应该依赖细节: 细节应该依赖抽象. 依赖倒置 ...

  10. 关于MooTools你应该熟知的6个基本知识

    MooTools是一个精简.模组化同时也面向对象的JavaScript框架,它设计给中等和进阶的JavaScript开发人员使用.使用 MooTools优美.详细而条理分明的API,可让你写出强大.富 ...