介绍

组成

1.PointNet classification network分类网络

part segmentation network

数据集

1.point clouds sampled from 3D shapes
2.ShapeNetPart dataset.

结构

其主要分成以下三部分：

数据处理
model构建
结果选择

数据处理

将点云处理成程序可用的格式，具体实现在 provider.py 中，主要包含了数据下载、预处理（shuffle->rotate->jitter）、格式转换（hdf5->txt）

shuffle

def shuffle_data(data, labels):

    """ Shuffle data and labels.

        Input:

          data: B,N,... numpy array

          label: B,... numpy array

        Return:

          shuffled data, label and shuffle indices

    """

    idx = np.arange(len(labels))#返回一个列表

    # print('idx=',idx)#idx= [   0    1    2 ... 2045 2046 2047]

    np.random.shuffle(idx)#把idx进行shuffle

    # print('idx=', idx)

    return data[idx, ...], labels[idx], idx

rotate旋转处理

def rotate_point_cloud(batch_data):

    # print('batch data shape=',batch_data.shape)#(32, 1024, 3)

    rotated_data = np.zeros(batch_data.shape, dtype=np.float32)

    for k in range(batch_data.shape[0]):

        rotation_angle = np.random.uniform() * 2 * np.pi#生成一个随机数

        cosval = np.cos(rotation_angle)

        sinval = np.sin(rotation_angle)

        rotation_matrix = np.array([[cosval, 0, sinval],

                                    [0, 1, 0],

                                    [-sinval, 0, cosval]])

        shape_pc = batch_data[k, ...]

        rotated_data[k, ...] = np.dot(shape_pc.reshape((-1, 3)), rotation_matrix)

        #先让shape_pc的形状变成(?,3),因为旋转矩阵为(3,3)

    return rotated_data

jitter抖动处理

def jitter_point_cloud(batch_data, sigma=0.01, clip=0.05):

    B, N, C = batch_data.shape

    assert(clip > 0)

    jittered_data = np.clip(sigma * np.random.randn(B, N, C), -1*clip, clip)#将数组范围限制在(-1*clip, clip)

    jittered_data += batch_data

    return jittered_data

model构建

Feature transform net

with tf.variable_scope('transform_net1') as sc:#T-net

    transform = input_transform_net(point_cloud, is_training, bn_decay, K=3)

print('point cloud=',point_cloud)#(32, 1024, 3)

# print('input transform=',transform)#(32, 3, 3)

point_cloud_transformed = tf.matmul(point_cloud, transform)

# print('point_cloud_transformed=',point_cloud_transformed)#(32, 1024, 3)

mlp(64,128,1024)

net = tf_util.conv2d(net_transformed, 64, [1,1],

                         padding='VALID', stride=[1,1],

                         bn=True, is_training=is_training,

                         scope='conv3', bn_decay=bn_decay)

print('net3=',net)#(32, 1024, 1, 64)

net = tf_util.conv2d(net, 128, [1,1],

                         padding='VALID', stride=[1,1],

                         bn=True, is_training=is_training,

                         scope='conv4', bn_decay=bn_decay)

print('net4=',net)#(32, 1024, 1, 128)

net = tf_util.conv2d(net, 1024, [1,1],

                         padding='VALID', stride=[1,1],

                         bn=True, is_training=is_training,

                         scope='conv5', bn_decay=bn_decay)

print('net5=',net)#(32, 1024, 1, 1024)

类别投票

实现方法

batch_pred_sum.shape=(?,40) # 每个data对40个类的可能性

pred_val.shape=(?,) # 每个data所属的可能性最大的类

 pred_val = np.argmax(batch_pred_sum, 1)

 #返回沿轴axis最大值的索引,即得到预测值最大的那一类的idx(label)

评估

输出（预测label，真实label）

</dump/pred_label.txt>

4, 4

0, 0

2, 2

8, 8

14, 23

...

<shape_names.txt>

airplane

bathtub

bed

bench

bookshelf

bottle

bowl

car

chair

cone

cup

保存预测错误的图片，并可视化

</dump/xxxx_pred_name.jpg>
命名＝第几个预测错误的图片+真实label+预测label

例子　/dump/1028_label_bed_pred_sofa.jpg

三张点云图片，分别是当前点云数据旋转三个不同角度之后的样子

save code

  for i in range(start_idx, end_idx):

        l = current_label[i]

        total_seen_class[l] += 1

        total_correct_class[l] += (pred_val[i-start_idx] == l)

        fout.write('%d, %d\n' % (pred_val[i-start_idx], l))

        # print('!!!!!!!!!!','%d, %d\n' % (pred_val[i-start_idx], l))

        if pred_val[i-start_idx] != l and FLAGS.visu: # ERROR CASE, DUMP!如果预测错了

            img_filename = '%d_label_%s_pred_%s.jpg' % (error_cnt, SHAPE_NAMES[l],

                                                   SHAPE_NAMES[pred_val[i-start_idx]])

            #第几个预测错误的图片+真实label+预测label

            img_filename = os.path.join(DUMP_DIR, img_filename)

            output_img = pc_util.point_cloud_three_views(np.squeeze(current_data[i, :, :]))

            scipy.misc.imsave(img_filename, output_img)

            error_cnt += 1

画点云图的code

draw_point_cloud()
Input:
points: Nx3 numpy array
Output:
gray image

记录loss，预测精确度

/dump/log_evaluate.txt

eval mean loss: 1.816358

eval accuracy: 0.501216

eval avg class acc: 0.421297

  airplane: 0.980

   bathtub: 0.440

       bed: 0.940

     bench: 0.450

     ...

pointNet代码的更多相关文章

pointnet.pytorch代码解析
pointnet.pytorch代码解析代码运行 Training cd utils python train_classification.py --dataset <dataset pat ...
pointnet++之classification/train.py
1.数据集加载 if FLAGS.normal: assert(NUM_POINT<=10000) DATA_PATH = os.path.join(ROOT_DIR, 'data/modeln ...
pointnet++的pytorch实现
代码参考:https://blog.csdn.net/weixin_39373480/article/details/88934146 def recognize_all_data(test_area ...
pointnet++之scannet/train.py
1.作者可能把scannet数据集分成了训练集和测试集并处理成了.pickle文件. 2.在代码运行过程中,作者从.pickle文件中读出训练集1201个场景的x.y.z坐标和测试集312个场景的x. ...
论文笔记：（NIPS2017）PointNet++: Deep Hierarchical Feature Learning on Point Sets in a Metric Space
目录一. 存在的问题 1.提取局部特征的能力 2.点云密度不均问题二.解决方案 1.改进特征提取方法: (1)采样层(sampling) (2)分组层(grouping) (3)特征提取层(fea ...
论文笔记：（CVPR2017）PointNet: Deep Learning on Point Sets for 3D Classification and Segmentation
目录一. 存在的问题二. 解决的方案 1.点云特征 2.解决方法三. 网络结构四. 理论证明五.实验效果 1.应用 (1)分类: ModelNet40数据集 (2)部件分割:ShapeNet ...
日期格式代码出现两次的错误 ORA-01810
错误的原因是使用了两次MM . 一.Oracle中使用to_date()时格式化日期需要注意格式码如:select to_date('2005-01-01 11:11:21','yyyy-MM-dd ...
可爱的豆子——使用Beans思想让Python代码更易维护
title: 可爱的豆子--使用Beans思想让Python代码更易维护 toc: false comments: true date: 2016-06-19 21:43:33 tags: [Pyth ...
iOS代码规范（OC和Swift）
下面说下iOS的代码规范问题,如果大家觉得还不错,可以直接用到项目中,有不同意见可以在下面讨论下. 相信很多人工作中最烦的就是代码不规范,命名不规范,曾经见过一个VC里有3个按钮被命名为button ...

随机推荐

201871010136-赵艳强《面向对象程序设计（java）》第一周学习总结
项目内容这个作业属于哪个课程 https://www.cnblogs.com/nwnu-daizh/ 这个作业的要求在哪里 https://www.cnblogs.com/nwnu-daizh/ ...
01. Go 语言简介
Go语言简介引用原文地址:http://m.biancheng.net/golang/ Go语言也称 Golang,兼具效率.性能.安全.健壮等特性.这套Go语言教程(Golang教程)通俗易懂,深 ...
Paper | PyTorch: An Imperative Style, High-Performance Deep Learning Library
目录 0. 摘要 1. 简介 2. 背景 3. 设计原则 4. 针对易用性的核心设计 4.1 让深度学习模块不过是Python程序 4.2 互用性和可拓展性 4.3 自动差分 5. 针对高性能的PyT ...
Python爬虫教程-使用chardet
Spider-03-使用chardet继续学习python爬虫,我们经常出现解码问题,因为所有的页面编码都不统一,我们使用chardet检测页面的编码,尽可能的减少编码问题的出现网页编码问题解决使用 ...
Mac下vim安装taglist
1 安装taglist taglist 的安装非常简单.从vim官网的这个链接 http://www.vim.org/scripts/script.php?script_id=273,就可以下载到ta ...
解决centos下tomcat启动太慢 & JDBC连接oracle太慢的问题
近期遇到一个非常奇怪的问题,也不知道改了什么,tomcat启动非常慢,以前几秒就启动好了,现在要30秒左右. 而且,通过jdbc连接oracle数据库也非常慢,以前建立一个连接只要几十毫秒,现在也要1 ...
SqlServer ----- 根据查询语句创建视图
我们都知道视图的本质就是查询语句,那么就可以根据查询语句创建视图, 前提知道视图的组成,已经写好的sql 语句,多表或单表的查询语句,将查询语句变成视图. 所以视图可以由单表,多表或视图加表构成. ...
Spring MVC HTTP406 Not Acceptable
今天在搞前后端分离用springmvc传递json数据的时候,第一步就卡主了,本着完事开头难的做法(哈哈哈), 报了个406?什么鬼? 百度之后发现很多人也同我一样遇到过这个问题,记录下. 找到的处理 ...
C# 获取系统硬件可用信息
如何获取系统可用磁盘和可用内存? 1 获取磁盘信息这个有自带的 DriveInfo 可以用. DriveInfo 类 (System.IO) | Microsoft Docs 2 获取内存信息参考 ...
vue-列表动画
实现列表动画 li { border: 1px dashed #999; margin: 5px; line-height: 35px; padding-left: 5px; font-size: 1 ...

pointNet代码

介绍

组成

数据集

结构