发表于2015年5月PAMI

作者:

Kota Yamaguchi,

M.Hadi Kiapour,

Luis E. Ortiz,

Tamara L. Berg

相关工作:

【服装检索Clothing Retrieval】越来越多的人对clothing recognition problem增加兴趣,Automatic clothing recognition methods可以推动natural and semantic image search,这反映在论文3,4,5,6,7,8中:越来越多有关clothing recognition for retrieval or recommendation applications的论文出现。

其中论文【3】提出一个street-to-shop应用:想要根据现实生活照片从网店中匹配服装图片。使用稀疏编码的transfer matrix进行mapping(street image / shopping image),防止不同的two distribution差异对检索结果造成影响。论文【5】采用类似的cross-scenario检索方法,实例化一个服装解析器显式表现每个衣物件。论文【8】关注的是同一个问题,但是更在意mobile scenarios的效率问题。除了直接关注clothing retrieval的应用外,还有服装外观相似度的应用,如在视频集中找到同一个人【9】。除了与服装相关的应用增长,与服装相关的数据集也越来越多【1】【10】【11】。为了推动应用的发展,我们需要改进图片中衣服的识别准确度,方法之一就是clothing parsing:其目的是对一个人的每个像素给出一个语义标记,如衬衫、裤子、鞋子。本论文的目标就是提供一种clothing parsing方法,可以被有效的运用于很多服装应用中。

【属性识别Attribute Recognition】一般来说,属性和物体的显式特点相关,如:颜色、图案或者形状。对于衣服属性的研究有论文6,12,13,14,15。通常,属性分析建立在检测和定位衣服件或者衣服部位。衣服属性识别这个想法源于论文【16】,该文主要专注于上半身衣服识别。近来Berg等人【12】则提出使用text description自动发现属性并定位。Bossard等人【15】提供了一种从含噪音的Web图像中获取attribute classification的方法。Bourdev等人【13】提出的使用poselets、discriminative image patches(可以捕获图片中小的视觉图案)去检测衣服属性,如“戴着帽子”。因为属性通常不会孤立存在,Chen等人【14】使用CRF考虑属性间的co-occurrence。衣服属性识别的一个应用是retrieval scenarios。使用细粒度(fine-grained)属性检测器或者human-in-the-loop方法交互式的减少搜索结果,找到什么是用户搜索的或者建立用户搜索的具体目标模型。

【衣服或者人体确定】clothing recognition的一个重要应用就是person identification。论文有【19】【20】【21】【22】【23】【24】。

【服装解析clothing parsing】服装解析是一个相对比较新的话题,但是对于解决以上提出的应用、找到有效的服装表示(clothing representations)具有很重要的作用。衣服表示相关的论文【30】将衣服语法上建模成sketch templates。别的论文采用子空间的方法,描述衣服变形(clothing deformations)或者可变空间先验值(deformable spatial priors)【33】。这些方法主要专注于how to model shape deformations用于衣服识别,与他们不同,我们则采用clothing parsing。

继承上一篇论文《Parsing clothing in fashion photographs - 2012》阐述clothing parsing:形式化为一个使用CRF的超像素标记MAP估计,该方法主要亮点就是使用姿态估计用于clothing parsing。Dong等人之后提出将clothing parsing视为一个关于parselets的推理问题:一组最基础的图像块(image region)组成衣服原件(clothing items)【34】。Liu等人提出一个方法:在训练中消除像素级的指导而使用图像级的颜色标签【35】。

本文不同之处在于:1)在没有任何关于图片的先验信息的情况下,识别细粒度的衣服类别。2)本方法不依赖任何over-segmentation,克服了假设超像素均匀分布的限制。3)本方法利用了在关注时装的社会网络中的大量免费的、弱标记的网络图片。

【论文阅读】Retrieving Similar Similar Styles to Parse Clothing(相关工作)的更多相关文章

  1. 论文阅读笔记 Word Embeddings A Survey

    论文阅读笔记 Word Embeddings A Survey 收获 Word Embedding 的定义 dense, distributed, fixed-length word vectors, ...

  2. 论文阅读 | Universal Adversarial Triggers for Attacking and Analyzing NLP

    [code] [blog] 主要思想和贡献 以前,NLP中的对抗攻击一般都是针对特定输入的,那么他们对任意的输入是否有效呢? 本文搜索通用的对抗性触发器:与输入无关的令牌序列,当连接到来自数据集的任何 ...

  3. Bigtable 论文 阅读笔记 - 原理部分

    不支持markdown,桑心.更好的阅读体验请看:Github/Bigtable.md Paper: Google Bigtable paper Notes author: Lhfcws Wu Tim ...

  4. 论文阅读(Xiang Bai——【PAMI2017】An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application to Scene Text Recognition)

    白翔的CRNN论文阅读 1.  论文题目 Xiang Bai--[PAMI2017]An End-to-End Trainable Neural Network for Image-based Seq ...

  5. BITED数学建模七日谈之三:怎样进行论文阅读

    前两天,我和大家谈了如何阅读教材和备战数模比赛应该积累的内容,本文进入到数学建模七日谈第三天:怎样进行论文阅读. 大家也许看过大量的数学模型的书籍,学过很多相关的课程,但是若没有真刀真枪地看过论文,进 ...

  6. 【论文阅读】Parsing Clothing in Fashion Photographs(翻译与理解)

    发表于2012年 作者:Kota Yamaguchi M.Hadi Kiapour Luis E.Ortiz Tamara L.Berg 摘要:展示了一个从时装图片中解析衣服的有效方法,提供了一个一般 ...

  7. 论文阅读笔记 - YARN : Architecture of Next Generation Apache Hadoop MapReduceFramework

    作者:刘旭晖 Raymond 转载请注明出处 Email:colorant at 163.com BLOG:http://blog.csdn.net/colorant/ 更多论文阅读笔记 http:/ ...

  8. 论文阅读笔记 - Mesos: A Platform for Fine-Grained ResourceSharing in the Data Center

    作者:刘旭晖 Raymond 转载请注明出处 Email:colorant at 163.com BLOG:http://blog.csdn.net/colorant/ 更多论文阅读笔记 http:/ ...

  9. Deep Reinforcement Learning for Dialogue Generation 论文阅读

    本文来自李纪为博士的论文 Deep Reinforcement Learning for Dialogue Generation. 1,概述 当前在闲聊机器人中的主要技术框架都是seq2seq模型.但 ...

随机推荐

  1. codeforces 557D. Vitaly and Cycle 二分图染色

    题目链接 n个点, m条边, 问最少加几条边可以出现一个奇环, 在这种情况下, 有多少种加边的方式. 具体看代码解释 #include<bits/stdc++.h> using names ...

  2. Oracle SQL篇(三)Oracle ROWNUM 与TOP N分析

        首先我们来看一下ROWNUM: 含义解释: 1.rownum是oracle为从查询返回的行的编号,返回的第一行分配的是1,第二行是2,依此类推.这是一个伪列,可以用于限制查询返回的总行数. 2 ...

  3. 深入剖析哪些服务是Oracle 11g必须开启的

    这篇文章主要介绍了哪些服务是Oracle 11g必须开启的以及这些服务的详细介绍,需要的朋友可以参考下   成功安装Oracle 11g数据库后,你会发现自己电脑运行速度会变慢,配置较低的电脑甚至出现 ...

  4. javascript变量说明

    定义变量 var test = "hi"; 在这个例子中,声明了变量 test,并把它的值初始化为 "hi"(字符串).由于 ECMAScript 是弱类型的, ...

  5. 转:说说angularjs中的$parse和$eval

    说说AngularJS中的$parse和$eval AngularJS的初学者常常会对$parse和$eval两个内建服务感到有些困惑,今天我们就来说说AngularJS中的$parse和$eval. ...

  6. 二代USBKEY与一代USBKEY有什么区别?使用时需要注意什么?

    二代USBKEY相较于一代USBKEY产品,增加了屏幕以及按键功能:可通过二代USBKEY产品的屏幕查看交易或操作信息,通过按键的方式进行上翻.下翻.确认.取消等操作. 二代USBKEY产品采用Mic ...

  7. Qt之界面美化输入框(使用QSS确实非同凡响)

    我们先看下酷狗音乐的输入框效果图: 这里我们需要实现在输入框里面添加一个按钮(多个也一样),并且提供一个默认时候的文字..直接上代码好了. QHBoxLayout *lay = new QHBoxLa ...

  8. DropDownList控件学习

    using System; using System.Collections.Generic; using System.Linq; using System.Web; using System.We ...

  9. Android之ListView性能优化

    ListView滚动速度优化主要可以应用以下几点方法来实现: 1.使用Adapter提供的convertView convertView是Adapter提供的视图缓存机制,当第一次显示数据的时候,ad ...

  10. poj 2153 Rank List(查找,Map)

    题目链接:http://poj.org/problem?id=2153 思路分析: 判断Li Ming的成绩排名,需要在所有的数据章查找成绩比其高的人的数目,为查找问题. 查找问题可以使用Hash表, ...