【论文阅读】Retrieving Similar Similar Styles to Parse Clothing(相关工作)
发表于2015年5月PAMI
作者:
Kota Yamaguchi,
M.Hadi Kiapour,
Luis E. Ortiz,
Tamara L. Berg
相关工作:
【服装检索Clothing Retrieval】越来越多的人对clothing recognition problem增加兴趣,Automatic clothing recognition methods可以推动natural and semantic image search,这反映在论文3,4,5,6,7,8中:越来越多有关clothing recognition for retrieval or recommendation applications的论文出现。
其中论文【3】提出一个street-to-shop应用:想要根据现实生活照片从网店中匹配服装图片。使用稀疏编码的transfer matrix进行mapping(street image / shopping image),防止不同的two distribution差异对检索结果造成影响。论文【5】采用类似的cross-scenario检索方法,实例化一个服装解析器显式表现每个衣物件。论文【8】关注的是同一个问题,但是更在意mobile scenarios的效率问题。除了直接关注clothing retrieval的应用外,还有服装外观相似度的应用,如在视频集中找到同一个人【9】。除了与服装相关的应用增长,与服装相关的数据集也越来越多【1】【10】【11】。为了推动应用的发展,我们需要改进图片中衣服的识别准确度,方法之一就是clothing parsing:其目的是对一个人的每个像素给出一个语义标记,如衬衫、裤子、鞋子。本论文的目标就是提供一种clothing parsing方法,可以被有效的运用于很多服装应用中。
【属性识别Attribute Recognition】一般来说,属性和物体的显式特点相关,如:颜色、图案或者形状。对于衣服属性的研究有论文6,12,13,14,15。通常,属性分析建立在检测和定位衣服件或者衣服部位。衣服属性识别这个想法源于论文【16】,该文主要专注于上半身衣服识别。近来Berg等人【12】则提出使用text description自动发现属性并定位。Bossard等人【15】提供了一种从含噪音的Web图像中获取attribute classification的方法。Bourdev等人【13】提出的使用poselets、discriminative image patches(可以捕获图片中小的视觉图案)去检测衣服属性,如“戴着帽子”。因为属性通常不会孤立存在,Chen等人【14】使用CRF考虑属性间的co-occurrence。衣服属性识别的一个应用是retrieval scenarios。使用细粒度(fine-grained)属性检测器或者human-in-the-loop方法交互式的减少搜索结果,找到什么是用户搜索的或者建立用户搜索的具体目标模型。
【衣服或者人体确定】clothing recognition的一个重要应用就是person identification。论文有【19】【20】【21】【22】【23】【24】。
【服装解析clothing parsing】服装解析是一个相对比较新的话题,但是对于解决以上提出的应用、找到有效的服装表示(clothing representations)具有很重要的作用。衣服表示相关的论文【30】将衣服语法上建模成sketch templates。别的论文采用子空间的方法,描述衣服变形(clothing deformations)或者可变空间先验值(deformable spatial priors)【33】。这些方法主要专注于how to model shape deformations用于衣服识别,与他们不同,我们则采用clothing parsing。
继承上一篇论文《Parsing clothing in fashion photographs - 2012》阐述clothing parsing:形式化为一个使用CRF的超像素标记MAP估计,该方法主要亮点就是使用姿态估计用于clothing parsing。Dong等人之后提出将clothing parsing视为一个关于parselets的推理问题:一组最基础的图像块(image region)组成衣服原件(clothing items)【34】。Liu等人提出一个方法:在训练中消除像素级的指导而使用图像级的颜色标签【35】。
本文不同之处在于:1)在没有任何关于图片的先验信息的情况下,识别细粒度的衣服类别。2)本方法不依赖任何over-segmentation,克服了假设超像素均匀分布的限制。3)本方法利用了在关注时装的社会网络中的大量免费的、弱标记的网络图片。
【论文阅读】Retrieving Similar Similar Styles to Parse Clothing(相关工作)的更多相关文章
- 论文阅读笔记 Word Embeddings A Survey
论文阅读笔记 Word Embeddings A Survey 收获 Word Embedding 的定义 dense, distributed, fixed-length word vectors, ...
- 论文阅读 | Universal Adversarial Triggers for Attacking and Analyzing NLP
[code] [blog] 主要思想和贡献 以前,NLP中的对抗攻击一般都是针对特定输入的,那么他们对任意的输入是否有效呢? 本文搜索通用的对抗性触发器:与输入无关的令牌序列,当连接到来自数据集的任何 ...
- Bigtable 论文 阅读笔记 - 原理部分
不支持markdown,桑心.更好的阅读体验请看:Github/Bigtable.md Paper: Google Bigtable paper Notes author: Lhfcws Wu Tim ...
- 论文阅读(Xiang Bai——【PAMI2017】An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application to Scene Text Recognition)
白翔的CRNN论文阅读 1. 论文题目 Xiang Bai--[PAMI2017]An End-to-End Trainable Neural Network for Image-based Seq ...
- BITED数学建模七日谈之三:怎样进行论文阅读
前两天,我和大家谈了如何阅读教材和备战数模比赛应该积累的内容,本文进入到数学建模七日谈第三天:怎样进行论文阅读. 大家也许看过大量的数学模型的书籍,学过很多相关的课程,但是若没有真刀真枪地看过论文,进 ...
- 【论文阅读】Parsing Clothing in Fashion Photographs(翻译与理解)
发表于2012年 作者:Kota Yamaguchi M.Hadi Kiapour Luis E.Ortiz Tamara L.Berg 摘要:展示了一个从时装图片中解析衣服的有效方法,提供了一个一般 ...
- 论文阅读笔记 - YARN : Architecture of Next Generation Apache Hadoop MapReduceFramework
作者:刘旭晖 Raymond 转载请注明出处 Email:colorant at 163.com BLOG:http://blog.csdn.net/colorant/ 更多论文阅读笔记 http:/ ...
- 论文阅读笔记 - Mesos: A Platform for Fine-Grained ResourceSharing in the Data Center
作者:刘旭晖 Raymond 转载请注明出处 Email:colorant at 163.com BLOG:http://blog.csdn.net/colorant/ 更多论文阅读笔记 http:/ ...
- Deep Reinforcement Learning for Dialogue Generation 论文阅读
本文来自李纪为博士的论文 Deep Reinforcement Learning for Dialogue Generation. 1,概述 当前在闲聊机器人中的主要技术框架都是seq2seq模型.但 ...
随机推荐
- UVA 10798 - Be wary of Roses (bfs+hash)
10798 - Be wary of Roses You've always been proud of your prize rose garden. However, some jealous f ...
- html5储存篇(二)
indexedDB 相对于html5 中提到 web SQL Database,w3c已经明确声明放弃对其的继续支持,开始支持新的客户端数据库 indexedDB ,indexedDB 是一种no ...
- Yii2.0中文开发向导——rules常用规则
public function rules(){ return [ //必须填写 ['email, username, password,agree,verifyPassword,verifyCode ...
- EventStore的设计思路
EventStore的设计思路 最近打算用C#实现一个基于文件的EventStore. 什么是EventStore 关于什么是EventStore,如果还不清楚的朋友可以去了解下CQRS/Event ...
- Core 发布至Linux
ASP.NET Core 发布至Linux生产环境 Ubuntu 系统 ASP.NET Core 发布至Linux生产环境 Ubuntu 系统,之前跟大家讲解了 dotnet publish 发布,而 ...
- 射频识别技术漫谈(25)——Felica简介
Felica是SONY公司开发的射频识别技术,该技术使用的载波频率与ISO14443A和ISO14443B一样,都是13.56MHz,所以有人把它称为ISO14443C,但SONY并没有正式接受这样的 ...
- NS2 nam中节点及数据流颜色设置
NS2 节点颜色设置在http://hi.baidu.com/jrwen0/item/d105c642f4c3ce36fb89601b说明的比較具体,大家能够參见. 我这里想说的是数据流颜色的设置,相 ...
- HDU1029时钟(排序)
题意:是用两个指针的一个模拟时钟的时针和分针.两个指针形成一个角度.角度测量两个指针之间的最小角度.两只手之间的角度是大于或等于0,且小于或等于180度的度量.由于一个序列的五个不同的写入时间,格式为 ...
- [译]Stairway to Integration Services Level 15 – SSIS 参数回顾
介绍 在本文中我们会研究SSIS变量姐妹: SSIS 变量. 我们会演示参数配置,通过包参数管理动态属性值,然后会演示SSIS包执行的时候参数怎么被配置的. SSIS Parameters 101 S ...
- WPF qq界面(转)
原文:http://blog.csdn.net/u013981858/article/details/49130885 刚开始学WPF,自己写了个小东西,说实话写的并不好,好多东西不懂只是用现在懂的东 ...