Implicit Autoencoder for Point-Cloud Self-Supervised Representation Learning论文阅读

name555difficult 2024-08-23 12:27:49 原文

Implicit Autoencoder for Point-Cloud Self-Supervised Representation Learning

2023 ICCV

*Siming Yan, Zhenpei Yang, Haoxiang Li, Chen Song, Li Guan, Hao Kang, Gang Hua, Qixing Huang*; Proceedings of the IEEE/CVF International Conference on Computer Vision (ICCV), 2023, pp. 14530-14542

paper: [2201.00785] Implicit Autoencoder for Point-Cloud Self-Supervised Representation Learning (arxiv.org)
code: [SimingYan/IAE: ICCV 2023] "Implicit Autoencoder for Point-Cloud Self-Supervised Representation Learning" (github.com)

Abstract

总结：本文专注于autoencoder框架下的点云表示模型的性能优化，提出了sample-variant issue ，即不同采样（采样是因为网络处理体量限制，需要先对数据集中的数据进行降采样）引入的噪声不同，普通的autoencoder点云表示学习方法，例如Point-MAE拟合输入和重建点云保持完全一致，导致采样中的噪声一定程度上也影响到的了encoder输出的latent code，降低了对同一目标的不同点云的语义表示一致性，换句话说: limiting the model's ability to extract valuable information about the true 3D geometry。作者基于这一点提出了对于decoder的优化，decoder原来是重建点云数据，作者换为重建输入点云的隐式表示 （SDF、UDF、occupancy grid），并且原来的Loss函数（Chamfer Distance Loss，Earth Mover`s Distance）替换为：将重建的隐式表示，和输入点云计算得到的隐式表示之间的L1 distance（for SDF，UDF），或者cross entropy（for occupancy grid）。Loss替换还有一个好处在于大大降低了计算复杂度，使得输入点云的点数能够大大增多，论文中表明点数能从1k左右 -> 40k，在tesla V100的GPU加持下。

Sample Variation Issue

从图中不同的采样在不同位置的点云密度不同，密度大的自然网络容易学习，密度小的网络学习较为困难，但确实原来直接重建点云的方法，使得latent code不得不带有不同sample distinctive的特征描述，本文就意在解决这一问题，促使网络学习到更加generalize的特征）（for one 3D object）。

实验中显示了IAE思想的有效性，在分类任务中观察同类样本和非同类样本的特征描述相互之间的距离，可以看到IAE同类样本的聚类半径远小于显示重建点云：

Pipeline

这里主要说的pretrain阶段的decoder的输出，本文主要改进的也是他，这里的 \((g \circ f)(x | \mathcal{P})\) 表示这个autoencoder-decoder架构在 \(\mathcal{P}\) 采样输入样本下的重建出来的隐式表示， \(\lambda_{gt}\) 表示使用ground truth（数据集中的数据）计算出来的隐式表示，例如SDF、UDF、occupancy grid三种：

Experiment

看论文就行了，全SOTA，确实有效，并且替换其他encoder，与其他基于其encoder的方法作比较也是SOTA。

在隐式表示是occupancy grid用的decoder：

Implicit Autoencoder for Point-Cloud Self-Supervised Representation Learning论文阅读的更多相关文章

Chinese word segment based on character representation learning 论文笔记
论文名和编号摘要/引言相关背景和工作论文方法/模型实验(数据集)及分析(一些具体数据) 未来工作/不足是否有源码问题原因解决思路优势基于表示学习的中文分词编号:1001-908 ...
论文解读（GRACE）《Deep Graph Contrastive Representation Learning》
Paper Information 论文标题:Deep Graph Contrastive Representation Learning论文作者:Yanqiao Zhu, Yichen Xu, Fe ...
论文解读（S^3-CL）《Structural and Semantic Contrastive Learning for Self-supervised Node Representation Learning》
论文信息论文标题:Structural and Semantic Contrastive Learning for Self-supervised Node Representation Learn ...
论文解读（MERIT）《Multi-Scale Contrastive Siamese Networks for Self-Supervised Graph Representation Learning》
论文信息论文标题:Multi-Scale Contrastive Siamese Networks for Self-Supervised Graph Representation Learning ...
论文解读（SUBG-CON）《Sub-graph Contrast for Scalable Self-Supervised Graph Representation Learning》
论文信息论文标题:Sub-graph Contrast for Scalable Self-Supervised Graph Representation Learning论文作者:Yizhu Ji ...
论文解读（USIB）《Towards Explanation for Unsupervised Graph-Level Representation Learning》
论文信息论文标题:Towards Explanation for Unsupervised Graph-Level Representation Learning论文作者:Qinghua Zheng ...
论文解读GALA《Symmetric Graph Convolutional Autoencoder for Unsupervised Graph Representation Learning》
论文信息 Title:<Symmetric Graph Convolutional Autoencoder for Unsupervised Graph Representation Learn ...
翻译 Improved Word Representation Learning with Sememes
翻译 Improved Word Representation Learning with Sememes 题目 Improved Word Representation Learning with ...
Self-Supervised Representation Learning
Self-Supervised Representation Learning 2019-11-11 21:12:14 This blog is copied from: https://lilia ...
（转）Predictive learning vs. representation learning 预测学习与表示学习
Predictive learning vs. representation learning 预测学习与表示学习 When you take a machine learning class, ...

随机推荐

HBase 中的 JVM 与 GC
HBase中JVM基本配置在JVM中,默认情况下会设置minimum heap size 为 1/64 可用物理内存,并为maximum heap size设置 1/4 的物理可用内存(不过在Jav ...
最新最全的BMS/EMS/PCS六大国产“储能方案”，不信你全都看过！
作为国内领先的嵌入式产品平台提供商,创龙科技在"能源电力"行业拥有超过1000家客户,接下来就让小编向大家分享创龙科技推出的BMS/EMS/PCS"六大储能方案" ...
嵌入式测试手册——基于NXP iMX6ULL开发板（2）
基于测试板卡:创龙科技TLIMX6U-EVM是一款基于NXP i.MX 6ULL的ARM Cortex-A7高性能低功耗处理器设计的评估板,由核心板和评估底板组成.核心板经过专业的PCB Layout ...
yb课堂之自定义异常和配置《五》
开发自定义异常和配置自定义异常继承RuntimeException 开发异常处理器ExceptionHandle YBException.java package net.ybclass.onli ...
Mac 版本10.15.4 安装 telnel工具
下载脚本 mac新版本安装telnel发生的变化,进入下面的链接,右键另存为,保存到桌面 https://raw.githubusercontent.com/Homebrew/install/mast ...
洛谷P1439
这道题也给了我很多的思考,因为很久没有做过LIS和KLCS的题了为什么能采用二分因为f数组保存的是LCS长度为i时的最小末尾的值,可以证明f数组一定是单调的,并且是严格单调的为什么要保存末尾最小 ...
面向对象VS面向过程
什么是面向对象呢? 对于接触或者熟悉一些编程知识的同学来讲,"面向对象"这个词儿一点儿也不陌生.经常听说XX语言是完全面向对象的编程语言,比如C#.Java这些便是完全面向对象的编 ...
webpack4.15.1 学习笔记(一) — 基本概念
目录入口(entry) 出口(output) 加载器 Loaders 插件 Plugins 模式 webpack.config.js 配置终终终终于下定决心,对你下手了,系统的学习一下. webp ...
JavaScript 常用 Web APIs
Web APIs Web APIs DOM 页面文档对象模型 DOM 树获取元素事件监听事件事件解绑操作元素样式属性操作结点操作结点关系创建节点 DOM 事件流事件对象常用鼠标事 ...
2024 暑假友谊赛 1 （7.13）zhaosang
A-A https://vjudge.net/contest/638765#problem/A 一开始贪心做不出来,后面发现是dp找到转移方程即可,01dp问题代码如下 #include <b ...