pointnet.pytorch代码解析

代码运行

Training

cd utils

python train_classification.py --dataset <dataset path> --nepoch=<number epochs> --dataset_type <modelnet40 | shapenet>

python train_segmentation.py --dataset <dataset path> --nepoch=<number epochs>

运行结果

Classification on ShapeNet

epoch = 10 Overall Acc

Original implementation N/A

this implementation(无 feature transform) 95.6

this implementation(有 feature transform) 92.97
Segmentation on ShapeNet

epoch = 10	Overall Acc
Original implementation	N/A
this implementation(无 feature transform)	95.6
this implementation(有 feature transform)	92.97

dataset代码

读取的数据格式

ShapeNetDataset()：默认读取分割数据，返回值d：点云个数*（点云数据ps，标签seg）

数据ps：torch.Size([2500, 3]) torch.FloatTensor ，一个点云有2500个点，每个点3个特征

标签seg：torch.Size([2500]) torch.LongTensor，每个点都有一个标签

代码及注释如下：

if __name__ == '__main__':

dataset = sys.argv[1]           # 运行命令中传入的第一个参数

datapath = sys.argv[2]          # 运行命令中传入的第二个参数

if dataset == 'shapenet':

    # 读取标签为Chair的分割数据

    d = ShapeNetDataset(root = datapath, class_choice = ['Chair'])

    print(len(d))   #2658，共有2658个Chair点云

    ps, seg = d[0]

    print(ps.size(), ps.type(), seg.size(),seg.type())

    # torch.Size([2500, 3]) torch.FloatTensor ，第一个点云有2500个点，每个点3个特征

    # torch.Size([2500]) torch.LongTensor，每个点都有一个标签

    d = ShapeNetDataset(root = datapath, classification = True)

    print(len(d))

    ps, cls = d[0]

    print(ps.size(), ps.type(), cls.size(),cls.type())

    # torch.Size([2500, 3]) torch.FloatTensor torch.Size([1]) torch.LongTensor，每个点云一个标签

    # get_segmentation_classes(datapath)

数据读取

model代码

网络整体结构

if __name__ == '__main__':

    # input transform

    sim_data = Variable(torch.rand(32,3,2500))          # 32个点云，3个特征，2500个点

    trans = STN3d()

    out = trans(sim_data)                               # stn torch.Size([32, 3, 3])，返回3x3的输入变换矩阵

    print('stn', out.size())

    print('loss', feature_transform_regularizer(out))

    # feature transform

    sim_data_64d = Variable(torch.rand(32, 64, 2500))

    trans = STNkd(k=64)

    out = trans(sim_data_64d)                           # stn64d torch.Size([32, 64, 64])，返回64x64的特征变换矩阵

    print('stn64d', out.size())

    print('loss', feature_transform_regularizer(out))

    # global feat

    pointfeat = PointNetfeat(global_feat=True)

    out, _, _ = pointfeat(sim_data)                     # global feat torch.Size([32, 1024])，32个点云，每个有1024维全局特征

    print('global feat', out.size())

    # point feat

    pointfeat = PointNetfeat(global_feat=False)

    out, _, _ = pointfeat(sim_data)                     # point feat torch.Size([32, 1088, 2500])，2500个点，每个点有1024+64维特征

    print('point feat', out.size())

    # Classification

    cls = PointNetCls(k = 5)

    out, _, _ = cls(sim_data)                           # class torch.Size([32, 5])，global feat经过全连接层，得到在5个类别上的概率信息

    print('class', out.size())

    # Segmentation

    seg = PointNetDenseCls(k = 3)

    out, _, _ = seg(sim_data)                           # seg torch.Size([32, 2500, 3])，point feat经过一维卷积，得到在3个类别上概率信息

    print('seg', out.size())

PointNetfeat特征提取网络

class PointNetfeat(nn.Module):

    '''

    点云的特征提取网络：global feature 和 point features

    '''

    def __init__(self, global_feat = True, feature_transform = False):

        super(PointNetfeat, self).__init__()

        self.stn = STN3d()

        self.conv1 = torch.nn.Conv1d(3, 64, 1)

        self.conv2 = torch.nn.Conv1d(64, 128, 1)

        self.conv3 = torch.nn.Conv1d(128, 1024, 1)

        self.bn1 = nn.BatchNorm1d(64)

        self.bn2 = nn.BatchNorm1d(128)

        self.bn3 = nn.BatchNorm1d(1024)

        self.global_feat = global_feat

        self.feature_transform = feature_transform

        if self.feature_transform:

            self.fstn = STNkd(k=64)

    def forward(self, x):

        n_pts = x.size()[2]

        trans = self.stn(x)

        x = x.transpose(2, 1)

        x = torch.bmm(x, trans)                 # 乘以3x3变换矩阵

        x = x.transpose(2, 1)

        x = F.relu(self.bn1(self.conv1(x)))

        if self.feature_transform:              # 特征变换，64x64矩阵

            trans_feat = self.fstn(x)

            x = x.transpose(2,1)

            x = torch.bmm(x, trans_feat)

            x = x.transpose(2,1)

        else:

            trans_feat = None

        pointfeat = x                           # nx64的点特征

        x = F.relu(self.bn2(self.conv2(x)))

        x = self.bn3(self.conv3(x))

        x = torch.max(x, 2, keepdim=True)[0]    # Maxpool

        x = x.view(-1, 1024)

        if self.global_feat:

            return x, trans, trans_feat         # x：mx1x1024的global feature，两个变换矩阵

        else:

            x = x.view(-1, 1024, 1).repeat(1, 1, n_pts)

            return torch.cat([x, pointfeat], 1), trans, trans_feat      # global feature+point features = nx1088的点特征矩阵

pointnet.pytorch代码解析的更多相关文章

【论文笔记】AutoML for MCA on Mobile Devices——论文解读与代码解析
理论部分方法介绍本节将详细介绍AMC的算法流程.AMC旨在自动地找出每层的冗余参数. AMC训练一个强化学习的策略,对每个卷积层会给出其action(即压缩率),然后根据压缩率进行裁枝.裁枝后,A ...
VBA常用代码解析
031 删除工作表中的空行如果需要删除工作表中所有的空行,可以使用下面的代码. Sub DelBlankRow() DimrRow As Long DimLRow As Long Dimi As L ...
[nRF51822] 12、基础实验代码解析大全 · 实验19 - PWM
一.PWM概述: PWM(Pulse Width Modulation):脉冲宽度调制技术,通过对一系列脉冲的宽度进行调制,来等效地获得所需要波形. PWM 的几个基本概念: 1) 占空比:占空比是指 ...
[nRF51822] 11、基础实验代码解析大全 · 实验16 - 内部FLASH读写
一.实验内容: 通过串口发送单个字符到NRF51822,NRF51822 接收到字符后将其写入到FLASH 的最后一页,之后将其读出并通过串口打印出数据. 二.nRF51822芯片内部flash知识 ...
[nRF51822] 10、基础实验代码解析大全 · 实验15 - RTC
一.实验内容: 配置NRF51822 的RTC0 的TICK 频率为8Hz,COMPARE0 匹配事件触发周期为3 秒,并使能了TICK 和COMPARE0 中断. TICK 中断中驱动指示灯D1 翻 ...
[nRF51822] 9、基础实验代码解析大全 · 实验12 - ADC
一.本实验ADC 配置分辨率:10 位. 输入通道:5,即使用输入通道AIN5 检测电位器的电压. ADC 基准电压:1.2V. 二.NRF51822 ADC 管脚分布 NRF51822 的ADC ...
java集合框架之java HashMap代码解析
java集合框架之java HashMap代码解析文章Java集合框架综述后,具体集合类的代码,首先以既熟悉又陌生的HashMap开始. 源自http://www.codeceo.com/arti ...
Kakfa揭秘 Day8 DirectKafkaStream代码解析
Kakfa揭秘 Day8 DirectKafkaStream代码解析今天让我们进入SparkStreaming,看一下其中重要的Kafka模块DirectStream的具体实现. 构造Stream ...
linux内存管理--slab及其代码解析
Linux内核使用了源自于 Solaris 的一种方法,但是这种方法在嵌入式系统中已经使用了很长时间了,它是将内存作为对象按照大小进行分配,被称为slab高速缓存. 内存管理的目标是提供一种方法,为实 ...

随机推荐

system表空间
system : 1.空间,管理:字典所在,不放用户数据;一般单个数据文件即可. 如果system表空间不够大,即可设置自动扩展,或者bigfile 2.system 备份必须归档下才能open下 ...
32.qt quick-PathView实现好看的home界面
pathView的使用类似与ListView,都需要模型(model)和代理(delegate),只不过pathView多了一个路径(path)属性,顾名思义路径就是item滑动的路径. 一个Path ...
typescript 中的 infer 关键字的理解
infer 这个关键字,整理记录一下,避免后面忘记了.有点难以理解呢. infer infer 是在 typescript 2.8中新增的关键字. infer 可以在 extends 条件类型的字句中 ...
『心善渊』Selenium3.0基础 — 13、Selenium操作下拉菜单
目录 1.使用Selenium中的Select类来处理下拉菜单(推荐) 2.下拉菜单对象的其他操作(了解) 3.通过元素二次定位方式操作下拉菜单(重点) (1)了解元素二次定位 (2)示例: 页面中的 ...
【网络编程】HTTP简介&URL
目录前言 1. http 简介 1.1 概念 1.2 原理 1.3 特点 2. URL 简介 2.1 概念 2.2 URL 通用格式 2.3 网页地址实例说明 3. HTTP 消息结构 3.1 客 ...
CentOS-关闭防火墙和禁用安全策略
关闭防火墙默认使用的是firewall作为防火墙查看防火墙状态 $ firewall-cmd --state 停止firewall $ systemctl stop firewalld.servi ...
MySQL索引类型总结和使用技巧以及注意事项（转）
在数据库表中,对字段建立索引可以大大提高查询速度.假如我们创建了一个 mytable表: 代码如下: CREATE TABLE mytable( ID INT NOT NULL, us ...
linux学习之路第八天（linux文件权限详解）
建议和我上一篇博客一起通读,效果更加 1.权限的基本介绍通过一张图片解决疑惑(重点) rwx权限详解 rwx作用到文件 1)[r]代表可读(read) :可以读取,查看 2)[w]代表可写(writ ...
ctf常见编码形式(罗师傅）
https://zhuanlan.zhihu.com/p/30323085 这是原链接 ASCII编码 •ASCII编码大致可以分作三部分组成: •第一部分是:ASCII非打印控制字符(参详ASCII ...
buu firmware
一.路由器固件,给的是bin文件,要用binwalk将固件文件系统提取出来,同时binwalk的版本要完整不然解压不了文件,下面说的很清楚了. https://blog.csdn.net/QQ1084 ...

pointnet.pytorch代码解析

pointnet.pytorch代码解析

代码运行

运行结果

dataset代码

model代码

pointnet.pytorch代码解析的更多相关文章

随机推荐

热门专题