Implicit Autoencoder for Point-Cloud Self-Supervised Representation Learning论文阅读

name555difficult 2024-08-23 12:27:49 原文

Implicit Autoencoder for Point-Cloud Self-Supervised Representation Learning

2023 ICCV

*Siming Yan, Zhenpei Yang, Haoxiang Li, Chen Song, Li Guan, Hao Kang, Gang Hua, Qixing Huang*; Proceedings of the IEEE/CVF International Conference on Computer Vision (ICCV), 2023, pp. 14530-14542

paper: [2201.00785] Implicit Autoencoder for Point-Cloud Self-Supervised Representation Learning (arxiv.org)
code: [SimingYan/IAE: ICCV 2023] "Implicit Autoencoder for Point-Cloud Self-Supervised Representation Learning" (github.com)

Abstract

总结：本文专注于autoencoder框架下的点云表示模型的性能优化，提出了sample-variant issue ，即不同采样（采样是因为网络处理体量限制，需要先对数据集中的数据进行降采样）引入的噪声不同，普通的autoencoder点云表示学习方法，例如Point-MAE拟合输入和重建点云保持完全一致，导致采样中的噪声一定程度上也影响到的了encoder输出的latent code，降低了对同一目标的不同点云的语义表示一致性，换句话说: limiting the model's ability to extract valuable information about the true 3D geometry。作者基于这一点提出了对于decoder的优化，decoder原来是重建点云数据，作者换为重建输入点云的隐式表示 （SDF、UDF、occupancy grid），并且原来的Loss函数（Chamfer Distance Loss，Earth Mover`s Distance）替换为：将重建的隐式表示，和输入点云计算得到的隐式表示之间的L1 distance（for SDF，UDF），或者cross entropy（for occupancy grid）。Loss替换还有一个好处在于大大降低了计算复杂度，使得输入点云的点数能够大大增多，论文中表明点数能从1k左右 -> 40k，在tesla V100的GPU加持下。

Sample Variation Issue

从图中不同的采样在不同位置的点云密度不同，密度大的自然网络容易学习，密度小的网络学习较为困难，但确实原来直接重建点云的方法，使得latent code不得不带有不同sample distinctive的特征描述，本文就意在解决这一问题，促使网络学习到更加generalize的特征）（for one 3D object）。

实验中显示了IAE思想的有效性，在分类任务中观察同类样本和非同类样本的特征描述相互之间的距离，可以看到IAE同类样本的聚类半径远小于显示重建点云：

Pipeline

这里主要说的pretrain阶段的decoder的输出，本文主要改进的也是他，这里的 \((g \circ f)(x | \mathcal{P})\) 表示这个autoencoder-decoder架构在 \(\mathcal{P}\) 采样输入样本下的重建出来的隐式表示， \(\lambda_{gt}\) 表示使用ground truth（数据集中的数据）计算出来的隐式表示，例如SDF、UDF、occupancy grid三种：

Experiment

看论文就行了，全SOTA，确实有效，并且替换其他encoder，与其他基于其encoder的方法作比较也是SOTA。

在隐式表示是occupancy grid用的decoder：

Implicit Autoencoder for Point-Cloud Self-Supervised Representation Learning论文阅读的更多相关文章

Chinese word segment based on character representation learning 论文笔记
论文名和编号摘要/引言相关背景和工作论文方法/模型实验(数据集)及分析(一些具体数据) 未来工作/不足是否有源码问题原因解决思路优势基于表示学习的中文分词编号:1001-908 ...
论文解读（GRACE）《Deep Graph Contrastive Representation Learning》
Paper Information 论文标题:Deep Graph Contrastive Representation Learning论文作者:Yanqiao Zhu, Yichen Xu, Fe ...
论文解读（S^3-CL）《Structural and Semantic Contrastive Learning for Self-supervised Node Representation Learning》
论文信息论文标题:Structural and Semantic Contrastive Learning for Self-supervised Node Representation Learn ...
论文解读（MERIT）《Multi-Scale Contrastive Siamese Networks for Self-Supervised Graph Representation Learning》
论文信息论文标题:Multi-Scale Contrastive Siamese Networks for Self-Supervised Graph Representation Learning ...
论文解读（SUBG-CON）《Sub-graph Contrast for Scalable Self-Supervised Graph Representation Learning》
论文信息论文标题:Sub-graph Contrast for Scalable Self-Supervised Graph Representation Learning论文作者:Yizhu Ji ...
论文解读（USIB）《Towards Explanation for Unsupervised Graph-Level Representation Learning》
论文信息论文标题:Towards Explanation for Unsupervised Graph-Level Representation Learning论文作者:Qinghua Zheng ...
论文解读GALA《Symmetric Graph Convolutional Autoencoder for Unsupervised Graph Representation Learning》
论文信息 Title:<Symmetric Graph Convolutional Autoencoder for Unsupervised Graph Representation Learn ...
翻译 Improved Word Representation Learning with Sememes
翻译 Improved Word Representation Learning with Sememes 题目 Improved Word Representation Learning with ...
Self-Supervised Representation Learning
Self-Supervised Representation Learning 2019-11-11 21:12:14 This blog is copied from: https://lilia ...
（转）Predictive learning vs. representation learning 预测学习与表示学习
Predictive learning vs. representation learning 预测学习与表示学习 When you take a machine learning class, ...

随机推荐

Nuxt3 的生命周期和钩子函数（二）
title: Nuxt3 的生命周期和钩子函数(二) date: 2024/6/26 updated: 2024/6/26 author: cmdragon excerpt: 摘要:本文深入介绍了Nu ...
使用定时器：在logs目录，每两分钟产生一个文件
1.使用定时器:在logs目录,每两分钟产生一个文件(文件格式为:201711151323.log.201711151323.log.2017111513xx.log ...思路:定时器定时调用she ...
静态 top tree 入门
理论我们需要一个数据结构维护树上的问题,仿照序列上的问题,我们需要一个方法快速的刻画出信息. 比如说线段树就通过分治的方式来通过将一个区间划分成 \(\log n\) 个区间并刻画出这 \(\log ...
基于wxpython的时钟小工具
前言基于python3.10 + wxpython 的时钟小工具代码由chatgpt3.5生成,作者自己调试.留作后续参考. 正文 timer_ok.py import wx import tim ...
Http基础协议
浏览器请求方法 http1.0定义了三种: GET: 向服务器获取资源,比如常见的查询请求 POST: 向服务器提交数据而发送的请求 Head: 和get类似,返回的响应中没有具体的内容,用于获取报头 ...
GAIA: 一个严苛的智能体基准
简要概括经过一些实验,我们对 Transformers 智能体构建智能体系统的性能印象深刻,因此我们想看看它有多好!我们使用一个用库构建的代码智能体在 GAIA 基准上进行测试,这可以说是最困难 ...
如何优雅地使用Mybatis逆向工程生成类
文/朱季谦 1.环境:SpringBoot 2.在pom.xml文件里引入相关依赖: 1 <plugin> 2 <groupId>org.mybatis.generator&l ...
Claude是否超过Chatgpt,成为生成式AI的一哥？
Anthropic 周一推出了 Claude 3 ,据这家初创公司称,该系列中最有能力的 Claude 3 Opus 在各种基准测试中都优于 Openai 的竞争对手 GPT-4 和谷歌的 Gemin ...
推荐一款功能强大、界面优美的开源SSH跨平台终端软件WindTerm
WindTerm是一款开源免费且功能强大的终端软件,相比 MobaXterm自带中文支持.无论是在Windows.macOS还是Linux操作系统上,WindTerm都能提供出色的性能和稳定性.Win ...
[oeasy]python00134_[趣味拓展]python起源_历史_Guido人生_ABC编程语言_Tanenbaum
python 历史回忆上次内容颜文字是kaomoji 把字符变成一种图画的方法一层叠一层很多好玩儿的kaomoji是一层层堆叠起来的meme 添加图片注释,不超过 140 字(可选 ...