前言

前面给大家介绍了使用LabVIEW工具包实现图像分类，目标检测，今天我们来看一下如何使用LabVIEW实现Mask R-CNN图像实例分割。

一、什么是图像实例分割？

图像实例分割(Instance Segmentation)是在语义检测(Semantic Segmentation)的基础上进一步细化，分离对象的前景与背景，实现像素级别的对象分离。并且图像的语义分割与图像的实例分割是两个不同的概念，语义分割仅仅会区别分割出不同类别的物体，而实例分割则会进一步的分割出同一个类中的不同实例的物体。

计算机视觉中常见的一些任务（分类，检测，语义分割，实例分割）

二、什么是Mask R-CNN

Mask R-CNN是一个实例分割（Instance segmentation）算法，可以用来做“目标检测”、“目标实例分割”、“目标关键点检测”。 Mask R-CNN算法步骤：

首先，输入一幅你想处理的图片，然后进行对应的预处理操作，或者预处理后的图片；
将其输入到一个预训练好的神经网络中（ResNeXt等）获得对应的feature map；
对这个feature map中的每一点设定预定的ROI，从而获得多个候选ROI；
将这些候选的ROI送入RPN网络进行二值分类（前景或背景）和BB回归，过滤掉一部分候选的ROI
接着，对这些剩下的ROI进行ROIAlign操作（即先将原图和feature map的pixel对应起来，然后
feature map和固定的feature对应起来）；
最后，对这些ROI进行分类（N类别分类）、BB回归和MASK生成（在每一个ROI里面进行FCN操作）

三、LabVIEW调用Mask R-CNN图像实例分割模型

1、Mask R-CNN模型获取及转换

安装pytorch和torchvision
获取torchvision中的模型(我们获取预训练好的模型)：

model = models.detection.maskrcnn_resnet50_fpn(pretrained=True)

转onnx

 1 def get_pytorch_onnx_model(original_model):

 2     model=original_model

 3     # define the directory for further converted model save

 4     onnx_model_path = dirname

 5

 6     # define the name of further converted model

 7     onnx_model_name = "maskrcnn_resnet50.onnx"

 8 

 9     # create directory for further converted model

10     os.makedirs(onnx_model_path, exist_ok=True)

11 

12     # get full path to the converted model

13     full_model_path = os.path.join(onnx_model_path, onnx_model_name)

14     model.eval()

15 

16     x = torch.rand(1, 3, 640, 640)

17     # model export into ONNX format

18     torch.onnx.export(

19         original_model,

20         x,

21         full_model_path,

22         input_names=["input"],

23         output_names=["boxes", "labels", "scores", "masks"],

24         dynamic_axes={"input": [0, 1, 2, 3],"boxes": [0, 1],"labels": [0],"scores": [0],"masks": [0, 1, 2, 3]},

25         verbose=True,opset_version=11

26     )

27 

28     return full_model_path

完整获取及模型转换python代码如下：

 1 import os

 2 import torch

 3 import torch.onnx

 4 from torch.autograd import Variable

 5 from torchvision import models

 6 

 7 dirname, filename = os.path.split(os.path.abspath(__file__))

 8 print(dirname)

 9 

10 def get_pytorch_onnx_model(original_model):

11     model=original_model

12     # define the directory for further converted model save

13     onnx_model_path = dirname

14

15     # define the name of further converted model

16     onnx_model_name = "maskrcnn_resnet50.onnx"

17 

18     # create directory for further converted model

19     os.makedirs(onnx_model_path, exist_ok=True)

20 

21     # get full path to the converted model

22     full_model_path = os.path.join(onnx_model_path, onnx_model_name)

23     model.eval()

24 

25     x = torch.rand(1, 3, 640, 640)

26     # model export into ONNX format

27     torch.onnx.export(

28         original_model,

29         x,

30         full_model_path,

31         input_names=["input"],

32         output_names=["boxes", "labels", "scores", "masks"],

33         dynamic_axes={"input": [0, 1, 2, 3],"boxes": [0, 1],"labels": [0],"scores": [0],"masks": [0, 1, 2, 3]},

34         verbose=True,opset_version=11

35     )

36 

37     return full_model_path

38 

39 

40 model = models.detection.maskrcnn_resnet50_fpn(pretrained=True)

41 print(get_pytorch_onnx_model(model))

2、LabVIEW调用 Mask R-CNN （mask rcnn.vi）

注意：Mask R-CNN模型是没办法使用OpenCV dnn去加载的，因为有些算子不支持，所以我们主要使用LabVIEW开放神经网络交互工具包（ONNX)来加载推理模型。

onnxruntime调用onnx模型并选择加速方式

图像预处理

执行推理我们使用的模型是：maskrcnn_resnet50_fpn，其输出有四层，分别为boxes,labels,scores,masks,数据类型如下：

可以看到，labels的类型为INT64,所以我们的源码中需要“Get_Rresult_int64.vi,index为1，因为labels为第二层，即下标为1;

另外三个输出我们都可以使用float32来获取了，masks虽然数据类型是uint8,但在实操过程中发现，它其实做过归一化处理了，也可以使用float32.

后处理并实现实例分割因为后处理内容较多，所以直接封装为了一个子VI， mask_rcnn_post_process.vi，源码如下：

整体的程序框架如下：

实例分割结果如下，我们会发现这个模型跑起来，他花的时间比之前就更长了。因为他不但要获取每一个对象的区域，还要也要把这个区域的轮廓给框出来，我们可以看到五个人及篮球都框出来了，使用不同的颜色分割出来了。

3、LabVIEW调用 Mask R-CNN 实现实时图像分割（mask rcnn_camera.vi）

整体思想和上面检测图片的实力分割差不多，不过使用了摄像头，并加了一个循环，对每一帧对象进行实力分割，3080系列显卡可选择TensorRT加速推理，分割会更加流畅。我们发现这个模型其实很考验检测数量的，所以如果你只是对人进行分割，那可以选择一个干净一些的背景，整体检测速度就会快很多。

四、Mask-RCNN训练自己的数据集（检测行人）

1.准备工作

训练需要jupyterlab环境，没有安装的同学需要通过pip install jupyterlab 安装
如果无法解决jupyterlab环境可以使用colab或者kaggle提供的免费gpu环境进行训练
训练源码：mask-rcnn.ipynb

2.开始训练

根据提示运行这段代码，自动或手动下载依赖文件数据集并建立数据集解析类

定义单轮训练的函数：网络结构直接采用torchvison里现有的，不再重新定义

出现如下输出表示训练进行中

修改这个文件名，改成自己的图片名字，运行看下训练效果

3、训练效果

4、导出ONNX

总结

以上就是今天要给大家分享的内容。大家可关注微信公众号: VIRobotics，回复关键字：Mask R-CNN图像实例分割源码 获取本次分享内容的完整项目源码及模型。

如果有问题可以在评论区里讨论，提问前请先点赞支持一下博主哦，如您想要探讨更多关于LabVIEW与人工智能技术，欢迎加入我们的技术交流群：705637299，进群请备注暗号：LabVIEW 机器学习。

如果文章对你有帮助，欢迎关注、点赞、收藏

手把手教你使用LabVIEW实现Mask R-CNN图像实例分割的更多相关文章

CVPR2019 | 超越Mask R-CNN！华科开源图像实例分割新方法MS R-CNN
安妮乾明发自凹非寺本文转载自量子位(QbitAI) 实习生又立功了! 这一次,亮出好成绩的实习生来自地平线,是一名华中科技大学的硕士生. 他作为第一作者完成的研究Mask Scoring R- ...
手把手教你使用LabVIEW OpenCV DNN实现手写数字识别（含源码）
@ 目录前言一.OpenCV DNN模块 1.OpenCV DNN简介 2.LabVIEW中DNN模块函数二.TensorFlow pb文件的生成和调用 1.TensorFlow2 Keras模 ...
手把手教你使用LabVIEW人工智能视觉工具包快速实现传统Opencv算子的调用(含源码)
前言今天我们一起来使用LabVIEW AI视觉工具包快速实现图像的滤波与增强:图像灰度处理:阈值处理与设定:二值化处理:边缘提取与特征提取等基本操作.工具包的安装与下载方法可见之前的博客. 一.图像 ...
【YOLOv5】手把手教你使用LabVIEW ONNX Runtime部署 TensorRT加速，实现YOLOv5实时物体识别（含源码）
前言上一篇博客给大家介绍了LabVIEW开放神经网络交互工具包[ONNX],今天我们就一起来看一下如何使用LabVIEW开放神经网络交互工具包实现TensorRT加速YOLOv5. 以下是YOLOv ...
手把手教你使用LabVIEW人工智能视觉工具包快速实现图像读取与采集（含源码）
目录前言一.工具包位置二.图像采集与色彩空间转换 1.文件读写 2.实现图片读取 3.使用算子cvtColor实现颜色空间转换三.从摄像头采集图像 1.Camera类 2.属性节点 3.实现摄 ...
手把手教你使用LabVIEW OpenCV dnn实现图像分类（含源码）
@ 目录前言一.什么是图像分类? 1.图像分类的概念 2.MobileNet简介二.使用python实现图像分类(py_to_py_ssd_mobilenet.py) 1.获取预训练模型 2.使 ...
手把手教你使用LabVIEW OpenCV dnn实现物体识别（Object Detection）含源码
前言今天和大家一起分享如何使用LabVIEW调用pb模型实现物体识别,本博客中使用的智能工具包可到主页置顶博客LabVIEW AI视觉工具包(非NI Vision)下载与安装教程中下载一.物体识别 ...
使用LabVIEW实现基于pytorch的DeepLabv3图像语义分割
前言今天我们一起来看一下如何使用LabVIEW实现语义分割. 一.什么是语义分割图像语义分割(semantic segmentation),从字面意思上理解就是让计算机根据图像的语义来进行分割,例 ...
小草手把手教你LabVIEW串口仪器控制—安装使用仪器现有驱动
声明:很多仪器是没有驱动的.所以,具体问题具体分析.另外声明:所谓的驱动,也就是封装好的底层的串口通信程序,也是程序而已,只不过别人帮你做成了子 VI,让自己容易用.所以:不要弄混淆了概念.国外的很多 ...

随机推荐

如何使用.NET 6的IHostedService和BackgroundService？
大家好,我是张飞洪,感谢您的阅读,我会不定期和你分享学习心得,希望我的文章能成为你成长路上的垫脚石,让我们一起精进. 本章是<定制ASP NET 6.0框架系列文章>的第七篇.本文内容和定 ...
在DispatcherServlet.class中的，获取方法值中获取到的都是arg值
原先java虚拟机中在编译是不带着方法的形参的名称,但是在jdk8中是可以带了只需要在Settings中设置以下: -parameters 再把out文件中的production文件删到在查询bui ...
scp复制发送文件夹到其他服务器上
简述scp: scp是secure copy的简写,是linux系统下基于ssh登陆进行安全的远程文件拷贝命令. 写法: scp [可选参数] 登录名@地址:源路径目标路径. 举例:scp -r ...
c语言_二叉树的建立以及3种递归
二叉树c语言的实现二叉树的建立二叉树的数据结构 typedef struct node{ int data; struct node* left; struct node* ri ...
GB/T 28181联网系统通信协议结构和技术实现
技术回顾在本文开头,我们先一起回顾下GB/T28181联网系统通信协议结构: 联网系统在进行视音频传输及控制时应建立两个传输通道:会话通道和媒体流通道. 会话通道用于在设备之间建立会话并传输系统控制 ...
OpenDataV低代码平台新增组件流程
OpenDataV计划采用子库的方式添加子组件,即每一个组件都当做一个子库,子库有自己的依赖,而项目本身的依赖只针对框架,因此每一个组件我们都当做一个子库来开发.下面我带着大家一步步详细的开发一个数字 ...
Python数据科学手册-机器学习：线性回归
朴素贝叶斯是解决分类任务的好起点,线性回归是解决回归任务的好起点. 简单线性回归将数据拟合成一条直线. y = ax + b , a 是斜率, b是直线截距原始数据如下: 使用LinearRegr ...
nginx配置文件中location的三个匹配规则定义
#直接匹配网站根,通过域名访问网站首页比较频繁,使用这个会加速处理,官网如是说. #这里是直接转发给后端应用服务器了,也可以是一个静态首页 # 第一个必选规则 location = / { #prox ...
MinIO Client完全指南
官方文档地址:http://docs.minio.org.cn/docs/master/minio-client-complete-guide 下载,添加云存储服务参考这篇文章:https://www ...
Elasticsearch 集群健康值红色终极解决方案
文章转载自: https://mp.weixin.qq.com/s?__biz=MzI2NDY1MTA3OQ==&mid=2247483905&idx=1&sn=acaff63 ...

手把手教你使用LabVIEW实现Mask R-CNN图像实例分割

前言