kinect 深度图像去噪算法

算法设计思路

（1）读取16位深度图像到待处理图像帧组；

（2）ROI区域计算

由于kinect 彩色摄像头和红外深度摄像头是存在视角偏差的，经过视角对齐后，得到的深度图像是有黑边的。此处通过取帧组第一帧图像计算感兴趣区域ROI（注：kinect的摄像头视角是固定的，ROI区域也是固定的，所以只需要计算一次就够了，后续处理只需要使用计算好的就可以了）。ROI计算好，我们便可以在ROI区域做相应的图像处理操作了。

（3）多帧中值滤波

如果当前帧（i, j）处灰度不为0，不进行处理；如果为0，对图像帧组的各帧图像（i, j）位置的不为0的像素取出放入的data数组中，插入排序，取中值，代替（i, j）位置像素值。经过中值滤波后，很多黑洞已经被填充好了。

（4）空间1_近邻滤波

对待处理的图像帧，此时依然存在黑洞（由于数据集采集时，每一帧相差不是很远，有些地方在帧组的所有帧中都是黑洞。）。此时，采用的是空间近邻滤波方法，在（i, j）位置周围寻找像素值不为0的点来填充黑洞。【可以采取更好的方法】

主要代码实现

1. ROI区域计算

void kinectDenoising::setImageROI(bool isUpdate)

{

           if (!isUpdate)  // 若为false，定义ROI区域范围。

    {

        imageROI = cvRect(, , , );

    }

    else // 若为true，表示计算出ROI区域范围

    {

        IplImage* image8u = cvCreateImage(cvSize(width, height), IPL_DEPTH_8U, ); // 灰度图像格式

        IplImage* bitImage = cvCreateImage(cvSize(width, height), IPL_DEPTH_8U, );// 二值图像格式

//         cvShowImage("0", frameSet[0]);

        // 查看像素--正确

        for(int i=;i<height;i++)

        {

          for(int j=;j<width;j++)

          {

            double ImgPixelVal = cvGetReal2D( frameSet[], i, j );

            //输出像素值

            cout <<ImgPixelVal<<"  ";

          }

          cout << "\n"<<endl;

        }

        cout << "\n"<<endl;

        cout << "\n"<<endl;

        // 像素约束到[0, 255]空间中

        cvConvertScale(frameSet[], image8u, 255.0 / 4096.0, ); // 输入，输出，比例因子，平移因子

        // cvThreshold只对单通道数组进行固定阈值操作【8UC1（8位无符号整型单通道矩阵）、32FC1（32位浮点型单通道矩阵）】

        // 典型应用：对灰度图像进行阈值操作得到二值图像

        cvThreshold(image8u, bitImage, , , CV_THRESH_BINARY); // 二值化--> bitImage

        // 分配矩阵空间---必须为CV_32FC1，因为16U和8U不能满足cvReduce()结果的空间需求

        CvMat* rowReduced = cvCreateMat(, bitImage->width, CV_32FC1); // 行数、列数、预定义类型

        CvMat* colReduced = cvCreateMat(bitImage->height, , CV_32FC1);

        // 将二维数组转化为向量

        // 参数：输入矩阵、输出矩阵、维数（0表示矩阵处理成1行，1表示处理成1列）、输出矩阵的所有行/列的和。

        cvReduce(bitImage, rowReduced, , CV_REDUCE_SUM);

        cvReduce(bitImage, colReduced, , CV_REDUCE_SUM);

        // compute imageROI.x

        for (int i = ; i<rowReduced->cols; i++) // 1行，cols列

        {

            // CV_MAT_ELEM参数：（输入矩阵、提取元素类型、行、列）---> 从Mat矩阵中获取元素

            float temp = CV_MAT_ELEM(*rowReduced, float, , i);

            // 判断条件：当bitImage整列元素和大于其高度的1/3时，视为所需的点。

            if (temp > bitImage->height / )

            {

                imageROI.x = i;

                break;

            }

        }

        // compute imageROI.width

        for (int i = rowReduced->cols; i > ; i--)

        {

            float temp = CV_MAT_ELEM(*rowReduced, float, , i - );

            if (temp > bitImage->height / )

            {

                imageROI.width = i - imageROI.x;

                break;

            }

        }

        // compute imageROI.y

        for (int i = ; i<colReduced->rows; i++)

        {

            float temp = CV_MAT_ELEM(*colReduced, float, i, );

            if (temp>bitImage->height / )

            {

                imageROI.y = i;

                break;

            }

        }

        // compute imageROI.height

        for (int i = colReduced->rows; i > ; i--)

        {

            float temp = CV_MAT_ELEM(*colReduced, float, i - , );

            if (temp > bitImage->height / )

            {

                imageROI.height = i - imageROI.y;

                break;

            }

        }

        // 释放内存

        cvReleaseImage(&bitImage);

        cvReleaseImage(&image8u);

        cvReleaseMat(&rowReduced);

        cvReleaseMat(&colReduced);

    }

}

2. 多帧中值滤波

 void kinectDenoising::medianFiltering()

 {

     // set result image zero

     cvSetZero(denoisedImage);

     unsigned short data[nFrames];

     int total;

     // x : 4      width : 591

     // y : 36   height: 442

     // 行

     for (int i = imageROI.y; i < imageROI.y + imageROI.height; i++)

     {

         // denoiseImageData[j]表示的是image图像中第i行第j列的像素值

         unsigned short* denoisedImageData = (unsigned short*)(denoisedImage->imageData + i * denoisedImage->widthStep);

         // 列

         for (int j = imageROI.x; j < imageROI.x + imageROI.width; j++)

         {

             if(CV_IMAGE_ELEM(frameSet[], unsigned short, i, j) != ){

               denoisedImageData[j] =CV_IMAGE_ELEM(frameSet[], unsigned short, i, j);

             }

             else

             {

             total = ;   // 表示长度

             for (int k = ; k < nFrames; k++)

             {

 //                      cout << CV_IMAGE_ELEM(frameSet[k], unsigned short, i, j)<<  " " ;

                 // 多帧图像

                 // CV_IMAGE_ELEM(数据指针， 数据类型，像素行坐标、像素列坐标) --> 访问图像帧组(i,j)位置的数据

                 insertSort(data, total, CV_IMAGE_ELEM(frameSet[k], unsigned short, i, j));

             }

             if (total != )

             {

                 // 将(i,j)位置的像素值设置为时间域取中值

                 denoisedImageData[j] = data[total / ];

 //                 cout << denoisedImageData[j] <<  " " ;

             }

             }

         }

         cout << "\n" << endl;

     }

 }

 // 插入排序

 void insertSort(unsigned short* data, int& len, unsigned short newData)

 {

     if (newData != )

     {

         if (len == )

         {

             data[len++] = newData;

         }

         else

         {

             int i = len;

             while ((i > ) && (data[i - ] > newData) )

             {

                 data[i] = data[i - ];

                 i--;

             }

             data[i] = newData;

             len++;

         }

     }

 }

3. 空间1_近邻滤波

 void kinectDenoising::nearestFiltering()

 {

     CvPoint topLeft, downRight;

     IplImage* tempImage = cvCloneImage(denoisedImage); // 复制整个IplImage结构，连同ROI等参数

     // 行 [y, y + height]

     for (int i = imageROI.y; i < imageROI.y + imageROI.height; i++)

     {

         // denoiseImageData[j]表示的是image图像中第i行第j列的像素值

         unsigned short* data = (unsigned short*)(denoisedImage->imageData + denoisedImage->widthStep*i);

         // 列 [x, x + width]

         for (int j = imageROI.x; j < imageROI.x + imageROI.width; j++)

         {

             // 如果(i, j)位置像素值为0，视为无效点，向周围查找有效点！！

             for (int k = ; data[j] == ; k++) // k从1逐渐增大，直到data[j] != 0 是一个有效点

             {

                 // 左上点和右下点

                 // (j-k,i-k) ( j ,i-k) (j+k,i-k)

                 // (j-k, i ) ( j , i ) (j+k, i )

                 // (j-k,i+k) ( j ,i+k) (j+k,i+k)

                 topLeft = cvPoint(j - k, i - k);    // j为列数 i为行数【注意分别】

                 downRight = cvPoint(j + k, i + k);

                 /************************************************************/

                 for (int m = topLeft.x; (m <= downRight.x) && (data[j] == ); m++)

                 {

                     if (m<) continue;

                     if (m >= width) break;

                     if (topLeft.y >= )

                     {

                         // 获取中心点(j,i)左上角(topLeft.y,m)位置数据

                         unsigned short temp = CV_IMAGE_ELEM(tempImage, unsigned short, topLeft.y, m);

                         if (temp > )  // 从该像素左上角查找，找到有效的点，代替中心点的像素

                         {

                             data[j] = temp;

                             break;

                         }

                     }

                     if (downRight.y < height)

                     {

                         // 获取中心点(j,i)右下角(downRight.y,m)位置数据

                         unsigned short temp = CV_IMAGE_ELEM(tempImage, unsigned short, downRight.y, m);

                         if (temp > )

                         {

                             data[j] = temp;

                             break;

                         }

                     }

                 }

                 // (j-k,i-k) ( j ,i-k) (j+k,i-k)

                 // (j-k, i ) ( j , i ) (j+k, i )

                 // (j-k,i+k) ( j ,i+k) (j+k,i+k)

                 for (int m = topLeft.y; (m<downRight.y) && (data[j] == ); m++)

                 {

                     if (m<) continue;

                     if (m >= height) break;

                     if (topLeft.x>)

                     {

                         unsigned short temp = CV_IMAGE_ELEM(tempImage, unsigned short, m, topLeft.x);

                         if (temp > )

                         {

                             data[j] = temp;

                             break;

                         }

                     }

                     if (downRight.x<width)

                     {

                         unsigned short temp = CV_IMAGE_ELEM(tempImage, unsigned short, m, downRight.x);

                         if (temp > )

                         {

                             data[j] = temp;

                             break;

                         }

                     }

                 }

                 /************************************************************/

             }

         }

     }

     cvReleaseImage(&tempImage);

 }

算法实现效果

1. 原图

彩色图

深度图

2. 中值处理

3. 近邻处理

完整代码，待更新。

耗时统计

medianFiltering timeUsed = 13.263

nearestFiltering timeUsed = 12.807

filter timeUsed = 26.07

点云效果

载入点云：pcl_viewer ./data/pointcloud.pcd

原点云图

> Loading ./data/pointcloud.pcd [done, 963 ms : 236836 points]

去噪点云图

Loading ./data/pointcloud.pcd [done, 1065 ms : 258867 points]

kinect 深度图像去噪算法的更多相关文章

paper 132：图像去噪算法：NL-Means和BM3D
这篇文章写的非常好,确定要~认真~慎重~的转载了,具体请关注本文编辑作者:http://wenhuix.github.io/research/denoise.html 我不会告诉你这里的代码都是f ...
如何用70行Java代码实现深度神经网络算法
http://www.tuicool.com/articles/MfYjQfV 如何用70行Java代码实现深度神经网络算法时间 2016-02-18 10:46:17 ITeye 原文 htt ...
利用python深度学习算法来绘图
可以画画啊!可以画画啊!可以画画啊! 对,有趣的事情需要讲三遍. 事情是这样的,通过python的深度学习算法包去训练计算机模仿世界名画的风格,然后应用到另一幅画中,不多说直接上图! 这个是世界名画& ...
win10+anaconda+cuda配置dlib，使用GPU对dlib的深度学习算法进行加速（以人脸检测为例）
在计算机视觉和机器学习方向有一个特别好用但是比较低调的库,也就是dlib,与opencv相比其包含了很多最新的算法,尤其是深度学习方面的,因此很有必要学习一下.恰好最近换了一台笔记本,内含一块GTX1 ...
SSE图像算法优化系列二十一：基于DCT变换图像去噪算法的进一步优化（100W像素30ms）。
在优化IPOL网站中基于DCT(离散余弦变换)的图像去噪算法(附源代码) 一文中,我们曾经优化过基于DCT变换的图像去噪算法,在那文所提供的Demo中,处理一副1000*1000左右的灰度噪音图像耗时 ...
基于深度学习的恶意样本行为检测（含源码） ----采用CNN深度学习算法对Cuckoo沙箱的动态行为日志进行检测和分类
from:http://www.freebuf.com/articles/system/182566.html 0×01 前言目前的恶意样本检测方法可以分为两大类:静态检测和动态检测.静态检测是指并 ...
图像去噪算法：NL-Means和BM3D
图像去噪是非常基础也是非常必要的研究,去噪常常在更高级的图像处理之前进行,是图像处理的基础.可惜的是,目前去噪算法并没有很好的解决方案,实际应用中,更多的是在效果和运算复杂度之间求得一个平衡,再一次验 ...
"如何用70行Java代码实现深度神经网络算法" 的delphi版本
http://blog.csdn.net/hustjoyboy/article/details/50721535 "如何用70行Java代码实现深度神经网络算法" 的delphi ...
AI系统——机器学习和深度学习算法流程
终于考上人工智能的研究僧啦,不知道机器学习和深度学习有啥区别,感觉一切都是深度学习挖槽,听说学长已经调了10个月的参数准备发有2000亿参数的T9开天霹雳模型,我要调参发T10准备拿个Best Pa ...

随机推荐

微信小程序转发商品的详情页 + 转发功能（传参）
1.微信小程序转发传参,利用的还是onShareAppMessageapi 2.利用的还有json转换 JSON 是用于存储和传输数据的格式. JSON 通常用于服务端向网页传递数据函数描述JSO ...
超详细！CentOS 7 + Hadoop3.0.0 搭建伪分布式集群
超详细!CentOS 7 + Hadoop3.0.0 搭建伪分布式集群 ps:本文的步骤已自实现过一遍,在正文部分避开了旧版教程在新版使用导致出错的内容,因此版本一致的情况下照搬执行基本不会有大错误. ...
centos绑定https
1.百度云申请免费ssl证书一年一申请 2. https://www.wosign .com /faq/faq-apache-https.htm 3.注意ssl.conf里面各个证书的顺序证书路径 ...
【css】—— inline-block 4px 和图片底部 2px bug
首先我们观察一组案例: HTML结构很简单: <!DOCTYPE html> <html lang="en"> <head> <meta ...
1.HTML练习（二）
一.表格练习: 1.<table>标签:声明一个表格,它的常用属性如下: border属性定义表格的边框,设置值是数值 cellpadding属性定义单 ...
day 09 课后作业
# -*- coding: utf-8 -*-# @Time : 2018/12/28 14:25# @Author : Endless-cloud# @Site : # @File : 08 课后作 ...
资产管理 cmdb之ansible 获取服务器硬件、软件等信息
cmdb抓取服务信息的方式有很多种,可以使用自动化工具saltstack.ansible.puppet,或者使用其它模块直接ssh远程连接抓取服务器信息.这里记录一下用ansible的API接口调用s ...
2016级算法第六次上机-E.Bamboo之吃我一拳
Bamboo之吃我一拳分析当两个点的距离<=d时,才可以出拳,想要使得满足出拳条件的点对最少但不为0 寻找最近点对距离,得到的最近距离能够使得可以出拳的组数最少,因为除了最近点对外其他组合均 ...
ASP.NET：Application,Session,Cookie,ViewState和Cache之间的区别（转）
在ASP.NET中,有很多种保存信息的对象.例如:Application,Session,Cookie,ViewState和Cache等,那么它们有什么区别呢?每一种对象应用的环境是什么? 为了更清楚 ...
任务调度SpringTask
一.什么是任务调度在企业级应用中,经常会制定一些“计划任务”,即在某个时间点做某件事情,核心是以时间为关注点,即在一个特定的时间点,系统执行指定的一个操作.常见的任务调度框架有Quartz和Spri ...

kinect 深度图像去噪算法

kinect 深度图像去噪算法的更多相关文章

随机推荐

热门专题