Playing for Data: Ground Truth from Computer Games

ECCV 2016

  Project Page:http://download.visinf.tu-darmstadt.de/data/from_games/index.html

  arXiv Paper : http://arxiv.org/pdf/1608.02192.pdf

  

  摘要: 本文有意思哦,从游戏中的视频帧中得到新的训练数据,为什么用这些数据呢?众所周知,最近的计算机视觉很大程度上依赖于海量数据,但是数据总是有限的,那么,如何得到这些精致标注的数据呢?半监督?还是用无监督的方法来做呢?? 哦,对了,前两天刚玩的 GTA5 游戏画面不错哦,对了,能否用那些图像作为新的数据来源呢?毕竟,现在的游戏技术,已经使得画面“逆天”了。那么,本文就是将这些从现代电脑游戏中提取出来的像素级的分割图像映射。虽然,游戏的 source code 和 中间的游戏操作不可访问,本文表明图像 patches 之间的联系可以在游戏 和 图像硬件之间重建出来。这样就使得游戏中的图像之间可以快速传递 semantic labels,而不用访问 source code 或者 content 。实验证明利用这些产生的图像来协助语义分割可以大幅度的提升分割的性能:利用游戏截图得到的model 和 1/3 的 CamVid training set 超过了用光 CamVid training data 所得到的精度。

  所用的游戏截图如下所示,可以看出精湛的游戏画面,已经能够和现实相匹敌了:

  

  文章动机:本文从深度学习需要海量有标签数据 和 有限的标注能力 之间的矛盾作为起始点,开始展开讲述本文。精细化的标注一张图像,会耗费很长的时间,此处作者举了例子,然后对比本文提出的方法,则较大程度上减少了标注时间。

  本文探索利用了电脑游戏来构建大型的像素级标注来训练 semantic segmentation 系统。现代的开放游戏世界,如:GTA-5,看门狗,杀手47 等等高度的还原了一个真实的世界。他们的理想化,不仅在于高质量的物质材料外观 和 光线变化模拟;他们也涉及到游戏世界的内容:物体和环境的外部摆放,真实的纹理结构,车辆的运动,小物体出现增添了细节信息,玩家和环境的交互等等。

  游戏世界的尺寸,外观 和 行为都远比沙盒游戏更好,因为其缺乏这些充分的元素。但是,由于其中间的操作和游戏的内容都几乎不可见,那么细节的 semantic annoation 是非常具有挑战性的,这个问题可以通过一种称为 “detouring”的技术来解决。我们在游戏 和 操作系统之间添加了一种 wrapper 来允许我们记录,修改,和重新产生 render commands。更关键的是,其允许进行标签的传递,随着时间和物体,共享不同的资源。

  在同样的标注程度上,我们的方法节省了 3个数量级的时间。

  打破数据标注的鸿沟

  

  

  

论文笔记之:Playing for Data: Ground Truth from Computer Games的更多相关文章

  1. Deep Learning 16:用自编码器对数据进行降维_读论文“Reducing the Dimensionality of Data with Neural Networks”的笔记

    前言 论文“Reducing the Dimensionality of Data with Neural Networks”是深度学习鼻祖hinton于2006年发表于<SCIENCE > ...

  2. Self-paced Clustering Ensemble自步聚类集成论文笔记

    Self-paced Clustering Ensemble自步聚类集成论文笔记 2019-06-23 22:20:40 zpainter 阅读数 174  收藏 更多 分类专栏: 论文   版权声明 ...

  3. 深度学习论文笔记:Fast R-CNN

    知识点 mAP:detection quality. Abstract 本文提出一种基于快速区域的卷积网络方法(快速R-CNN)用于对象检测. 快速R-CNN采用多项创新技术来提高训练和测试速度,同时 ...

  4. 论文笔记:Towards Diverse and Natural Image Descriptions via a Conditional GAN

    论文笔记:Towards Diverse and Natural Image Descriptions via a Conditional GAN ICCV 2017 Paper: http://op ...

  5. 论文笔记 SSD: Single Shot MultiBox Detector

    转载自:https://zhuanlan.zhihu.com/p/33544892 前言 目标检测近年来已经取得了很重要的进展,主流的算法主要分为两个类型(参考RefineDet):(1)two-st ...

  6. 论文笔记:目标检测算法(R-CNN,Fast R-CNN,Faster R-CNN,FPN,YOLOv1-v3)

    R-CNN(Region-based CNN) motivation:之前的视觉任务大多数考虑使用SIFT和HOG特征,而近年来CNN和ImageNet的出现使得图像分类问题取得重大突破,那么这方面的 ...

  7. YOLO v1论文笔记

    You Only Look Once:Unified, Real-Time Object Detection   论文链接:https://arxiv.org/abs/1506.02640 Homep ...

  8. 《Hyperspectral Image Classification With Deep Feature Fusion Network》论文笔记

    论文题目<Hyperspectral Image Classification With Deep Feature Fusion Network> 论文作者:Weiwei Song, Sh ...

  9. Online Object Tracking: A Benchmark 论文笔记(转)

    转自:http://blog.csdn.net/lanbing510/article/details/40411877 有博主翻译了这篇论文:http://blog.csdn.net/roamer_n ...

随机推荐

  1. 使用变量替换批量部署GoldenGate

    GoldenGate运行时允许在参数文件中动态指定一个值,即在参数文件中使用一个变量,而不是一个静态的值,当启动OGG进程时,根据环境动态加载此变量的值,达到在不同环境中,通过变量定义,实现多个环境的 ...

  2. java.lang包的分类

    提供利用 Java 编程语言进行程序设计的基础类. 1>  最重要的类是 Object(它是类层次结构的根)和 Class(它的实例表示正在运行的应用程序中的类).   2>  把基本类型 ...

  3. POJ 1185 炮兵阵地(经典的状态压缩DP)

    题意:中文题. 思路,经典的状态压缩题目. 由于列长比较小,我们可以以行为阶段用状态压缩来做. 由于攻击只占两个格,这样从行的角度看,第i行的炮兵只与前i-1和前i-2行有关系.这样如果用j,k,l分 ...

  4. HDU 1045 - Fire Net (最大独立集)

    题意:给你一个正方形棋盘.每个棋子可以直线攻击,除非隔着石头.现在要求所有棋子都不互相攻击,问最多可以放多少个棋子. 这个题可以用搜索来做.每个棋子考虑放与不放两种情况,然后再判断是否能互相攻击来剪枝 ...

  5. JS 用window.open()函数,父级页面如何取到子级页面的返回值?

    父窗口:<html xmlns="http://www.w3.org/1999/xhtml"> <head runat="server"> ...

  6. Ubuntu安装samba的问题

    问题: root@ubuntu:~# apt-get install samba 正在读取软件包列表... 完成 正在分析软件包的依赖关系树 正在读取状态信息... 完成 有一些软件包无法被安装.如果 ...

  7. Python ~~~ 面向对象的利器

    class Rectangle(): # 有没有括号都行 . def __init__(self,x,y): self.x=x self.y=y def getPeri(self): def getA ...

  8. Qt中使用随机数

    新建Empty qmake project,命名为UseRand UseRand.pro SOURCES += \ main.cpp QT += core main.cpp #include < ...

  9. JLOI 提示问题

    按照题目意思模拟即可. Program XJOI2265; ..] of char=('a','e','i','o','u','A','E','I','O','U'); var s:ansistrin ...

  10. HDU 4396

    http://acm.hdu.edu.cn/showproblem.php?pid=4396 题意:在至少走k条边的前提下求最短路 思路:在原有最短路模板的基础上多加一维,dis[i][j]表示走到i ...