ShapeNet: An Information-Rich 3D Model Repository 阅读笔记
ShapeNet: An Information-Rich 3D Model Repository
注:本论文只是讲述数据库建立方法
摘要
ShapeNet是一个有丰富注释的大型形状存储库,由对象的3D CAD模型表示,这是一组数据集,对每个3D模型提供多种予以注释,包括一致性的刚性对齐,零件等等。
1. Introduction
1.计算三维形状的分割并建立它们之间的对应关系是几何形状分析中的两个基本问题。
2.计算机视觉现在比较火热的从2D图像中理解场景是视觉领域的一大挑战,这些研究的根源在于需要将语义附加到三维形状的表示中,并在大规模上这样做。
3.但是对于3D内容采用数据驱动方法所面临的一个关键瓶颈是缺乏可供社区使用的大规模、经过策划的3D模型数据集。
提出数据库的目标:
- 收集并集中三维模型数据集,帮助组织研究社区的工作。
- 支持需要3D模型数据的数据驱动方法。
- 能够评估和比较涉及几何的基本任务(例如,分割、对齐、对应)的算法。
- 用作表示真实世界对象及其语义的知识库。
2.Background and Related Work
在线3D模型数量大幅增长,但是很少3D模型集合可以提供有效的组织和注释,很少为单个模型提供有意义的文本描述,所以利用率低。
Princeton Shape Benchmark可能是迄今为止最著名和最常用的3D形状集合,但是比较小。相比之下,在计算机视觉和相关领域,已经有了一系列收集、组织和标记大型数据集的活动。
因此……
3.ShapeNet: An Information-Rich 3D Model Repository
ShapeNet是一个大型、信息丰富的3D模型存储库。它包含跨越多种语义类别的模型。与以前的三维模型存储库不同,它为每个模型提供了大量的注释集,以及存储库中的模型与存储库外的其他多媒体数据之间的链接。
在以下部分中,将讨论如何为ShapeNet收集3D模型,将添加哪些注释,如何生成这些注释,随着数据集的发展,注释将如何更新,以及将为社区提供哪些工具来搜索、浏览和利用现有数据,以及贡献新数据。
3.1 Data Collection
1.原始3D模型数据来自公共在线存储库或现有研究数据集。
2.虽然为这个项目开发的工具是通用的,但我们打算只包括日常世界中人们遇到的物体的三维模型。
3.2 Annotation Types
ShapeNet将包含一组丰富的注释,这些注释提供关于这些模型的语义信息,在它们之间建立链接,并链接到其他形式的数据(例如图像)。
- 与语言相关的注释:按基本类别命名对象对于索引、分组和链接到相关数据源非常有用。
- 几何注释:将ShapeNet与图像和视频数据集区分开来的一个关键特性是3D几何图形表示真实世界结构的保真度。1.刚性对齐:为每个模型建立一致的规范方向(例如,垂直和正面)对于各种任务非常重要;2.零件和关键点;3.对称;4.对象大小
- 功能注释:许多物品,尤其是人造物品,如家具和电器,都可以被人类使用。功能注释描述了这些使用模式。1.功能部件:部件对于理解物体结构、涉及3D形状的人类活动和人体工程学产品设计至关重要。2.启示:我们对功能和活动特定的启示注释感兴趣。此类注释的示例包括支持平面注释和用于各种对象操作的可抓取区域注释。
- 物理注释:真实对象存在于物理世界中,通常具有固定的物理属性,如尺寸和密度。1.表面材料;2.重量

3.3 Annotation Methodology
纯粹使用人工收集注释看似合理,但是通常使用混合方法。对可能的注释类型,首先通过算法预测每个模型实例的注释,然后,我们将通过crowd-sourcing pipelines和人类专家的检查来验证这些预测
3.4 Annotation Schema and Web API
4.Annotation Acquisition and Validation
构建ShapeNet的一个关键挑战是获取和验证注释的方法。我们的目标是提供高精度的所有注释。在尚未进行全面验证的情况下,我们的目标是估计每个注释的置信度,并记录其来源。这将使其他人能够正确估计我们提供的信息的可信度,并将其用于不同的应用。
4.1 类别注释
将每个3D模型分配给WordNet分类法中的一个或多个语法集。总体来说还是采用混合方式。
4.2 Hierarchical Rigid Alignment
这一步的目标是为每个类别中的模型建立一致的规范化方向。
尽管一致取向的概念似乎很自然,但有一个问题必须解决。我们用一个例子来解释。“扶手椅”、“椅子”和“座椅”是我们分类法中的三个类别,每个类别都是其后续类别的子类别。通过检查手臂、腿部和背部,可以很好地为“扶手椅”类别中的形状定义一致的方向。然而,很难定义“椅子”类别。例如,“侧椅”和“转椅”都是“椅子”的子类别,然而,转椅的腿结构与大多数侧椅截然不同。对“座椅”的定义变得更加模糊,它有“凳子”、“沙发”和“椅子”等子类别。然而,直立方向的概念仍然适用于分类学的大部分层次。
在上述讨论之后,自然会提出一种分层对齐方法,其基本思想是按照ShapeNet的分类法,以自下而上的方式对模型进行分层对齐。
4.3. Parts and Keypoints
对于零件,通过算法生成分割,然后让用户接受或修改这些分割中的零件,可以加快获取速度。
4.4. Symmetry Estimation
4.5. Physical Property Estimation
在给定的绝对尺寸下,我们现在通过填充体素化计算每个模型的总实体体积。
5.Current Statistics
在撰写本技术报告时,ShapeNet已经为大约300万个模型编制了索引。
6. Discussion and Future Work
- Additional annotation types
- Correspondences
- RGB-D data :传感器捕捉现实世界
- Annotation coverage
7.总结
作者坚信,ShapeNet将在以下几个方面为多个研究社区提供非常有用的资源:
- Data-driven research
- Training resource
- Benchmark dataset
ShapeNet: An Information-Rich 3D Model Repository 阅读笔记的更多相关文章
- Make3D Convert your image into 3d model
Compiling and Running Make3D on your own computer source: http://make3d.cs.cornell.edu/code_linux.ht ...
- QT Graphics-View 3D编程例子- 3D Model Viewer
学习在Graphics-View框架中使用opengl进行3D编程,在网上找了一个不错的例子“3D Model Viewer”,很值得学习. 可以在http://www.oyonale.com/acc ...
- 3d模型 手办制作 3d model manual production
3d模型 手办制作 3d model manual production 作者:韩梦飞沙 Author:han_meng_fei_sha 邮箱:313134555@qq.com E-mail: 313 ...
- WPF 3D model - Sphere, Cone, and Cylinder
原文:WPF 3D model - Sphere, Cone, and Cylinder Extending Visual3D - Sphere, Cone, and Cylinder http: ...
- [论文阅读笔记] Adversarial Learning on Heterogeneous Information Networks
[论文阅读笔记] Adversarial Learning on Heterogeneous Information Networks 本文结构 解决问题 主要贡献 算法原理 参考文献 (1) 解决问 ...
- [论文阅读笔记] Adversarial Mutual Information Learning for Network Embedding
[论文阅读笔记] Adversarial Mutual Information Learning for Network Embedding 本文结构 解决问题 主要贡献 算法原理 实验结果 参考文献 ...
- 论文阅读笔记 Improved Word Representation Learning with Sememes
论文阅读笔记 Improved Word Representation Learning with Sememes 一句话概括本文工作 使用词汇资源--知网--来提升词嵌入的表征能力,并提出了三种基于 ...
- Keras 文档阅读笔记(不定期更新)
目录 Keras 文档阅读笔记(不定期更新) 模型 Sequential 模型方法 Model 类(函数式 API) 方法 层 关于 Keras 网络层 核心层 卷积层 池化层 循环层 融合层 高级激 ...
- [阅读笔记]Software optimization resources
http://www.agner.org/optimize/#manuals 阅读笔记Optimizing software in C++ 7. The efficiency of differe ...
随机推荐
- linux单用户模式修改密码与系统启动级别
目录 一:系统启动级别 二:单用户模式修改密码 一:系统启动级别 系统启动级别: 0 关机 1 单用户模式(无法通过xshell方式使用)(虚拟机操作)(系统云服务商后台) 2 多用户无网络模式 3 ...
- Java多线程专题2: JMM(Java内存模型)
合集目录 Java多线程专题2: JMM(Java内存模型) Java中Synchronized关键字的内存语义是什么? If two or more threads share an object, ...
- Vue.js项目的兼容性与部署配置
一.处理兼容性问题的相关插件: 1> 解决移动端某些版本的浏览器,点击事件有3s延时触发的问题 · 安装 fastclick 依赖包:npm install fastclick --save-d ...
- 如何在pyqt中使用 QStyle 重绘 QSlider
前言 使用 qss 可以很方便地改变 QSlider 的样式,但是有些情况下 qss 无法满足我们的需求.比如下图所示样式: 如果直接使用 qss 将 handle 的内圆设置为透明背景,会看到 ha ...
- IDE连接数据库时测试Test Connection 无法点击
问题: IDE连接数据库时测试Test Connection 无法点击 解决: IDE缺少对应的驱动 第一步: 点击驱动 第二步: 下载驱动 注意:不同版本的驱动下载位置不同,此版本为2017
- 为什么内部类调用的外部变量必须是final修饰的?
感谢原文:https://blog.csdn.net/u010393325/article/details/80643636 因为生命周期的原因.方法中的局部变量,方法结束后这个变量就要释放掉,fin ...
- Swift字符串的介绍
字符串的介绍 字符串在任何的开发中使用都是非常频繁的 OC和Swift中字符串的区别 在OC中字符串类型时NSString,在Swift中字符串类型是String OC中字符串@"" ...
- redis中scan和keys的区别
scan和keys的区别 redis的keys命令,通来在用来删除相关的key时使用,但这个命令有一个弊端,在redis拥有数百万及以上的keys的时候,会执行的比较慢,更为致命的是,这个命令会阻塞r ...
- 判断js对象是否为空
let _isEmptyObj = function(obj) { for(var key in obj) { return false; } return true; }
- 无脑安装——Python 及 安装python集成开发环境pycharm
无脑安装--Python 及安装python集成开发环境pycharm 1.真机安装python 2.安装python集成开发环境pycharm Python 是一种解释型语言 Python 是面向对 ...