积分图实现均值滤波的CUDA代码

没想到我2010年买的笔记本显卡GT330M 竟然还能跑CUDA，果断小试了一把，环境为CUDA6.5+VS2012，写了一个积分图实现均值滤波。类似于OpenCV的blur()函数。

使用lena.jpg做测试，效果如下：

代码在此：

#include "cuda_runtime.h"

#include "device_launch_parameters.h"

#include <stdio.h>

#include <opencv2\opencv.hpp>

using namespace std;

using namespace cv;

 __global__ void rowAddKernel(float* pIntegImgLena,int* pPtsImg,int imgW,int imgH)

 {

     const int tidx=blockDim.x*blockIdx.x + threadIdx.x;

     if (tidx<imgW)

     {

         for (int j=; j<imgH; j++)

         {

             pIntegImgLena[j*imgW+ tidx] +=pIntegImgLena[(j-)*imgW+tidx];

             pPtsImg[j*imgW+ tidx] +=pPtsImg[(j-)*imgW+ tidx];

         }

     }

 }

  __global__ void colAddKernel(float* pIntegImgLena,int* pPtsImg,int imgW,int imgH)

 {

     const int tidy=blockDim.y*blockIdx.y + threadIdx.y;

     if (tidy<imgH)

     {

         for (int i=; i<imgW; i++)

         {

             pIntegImgLena[tidy*imgW+ i] +=pIntegImgLena[tidy*imgW+i-];

             pPtsImg[tidy*imgW+ i] +=pPtsImg[tidy*imgW+ i-];

         }

     }

 }

 __global__ void filterKernel(uchar* pImgLena,float* pIntegImgLena,int* pPtsImg,int imgW,int imgH,int win)

 {

     const int tidx=blockDim.x*blockIdx.x + threadIdx.x;

     const int tidy=blockDim.y*blockIdx.y + threadIdx.y;

     if (tidx<imgW && tidy<imgH)

     {

         int left=tidx-win;

         int right=tidx+win;

         int top=tidy-win;

         int bot=tidy+win;

         left=max(left, );

         right=min(right, imgW-);

         top=max(top, );

         bot=min(bot, imgH-);

         int id1=top*imgW+left;

         int id2=top*imgW+right;

         int id3=bot*imgW+left;

         int id4=bot*imgW+right;

         int cnt=pPtsImg[id4]+pPtsImg[id1]-pPtsImg[id2]-pPtsImg[id3];

         float sum=pIntegImgLena[id4]+pIntegImgLena[id1]-pIntegImgLena[id2]-pIntegImgLena[id3];

         float value=sum/cnt;

         pImgLena[tidy*imgW+tidx]=(uchar)value;

     }

 }

void main()

{

    //读取原图像

    string imgPath="data/lena.jpg";

    Mat imgLena=imread(imgPath, );

    int imgH=imgLena.rows;

    int imgW=imgLena.cols;

    namedWindow("lena");

    imshow("lena", imgLena);

    waitKey();

    //滤波后的lena

     Mat filterLena=imgLena.clone();

     filterLena.setTo();

    //积分图以及坐标索引图

    Mat integImgLena=Mat::zeros(imgLena.size(), CV_32FC1);

    Mat ptsImg=Mat::zeros(imgLena.size(), CV_32SC1);

    //积分图初始化

    imgLena.convertTo(imgLena, CV_32FC1);

    integImgLena=imgLena.clone();

    ptsImg.setTo();

    //分配内存

    uchar* pImgLena=NULL;

    float* pIntegImgLena=NULL;

    int* pPtsImg=NULL;

    cudaMalloc(&pImgLena, imgH*imgW*sizeof(uchar));

    cudaMalloc(&pIntegImgLena, imgH*imgW*sizeof(float));

    cudaMalloc(&pPtsImg, imgH*imgW*sizeof(int));

    //拷贝数据至GPU

    cudaMemcpy(pImgLena, imgLena.data,imgH*imgW*sizeof(uchar), cudaMemcpyHostToDevice);

    cudaMemcpy(pIntegImgLena, integImgLena.data,imgH*imgW*sizeof(float), cudaMemcpyHostToDevice);

    cudaMemcpy(pPtsImg, ptsImg.data,imgH*imgW*sizeof(int), cudaMemcpyHostToDevice);

    //按行求前缀和

    dim3 block(,);

    dim3 grid((imgW+block.x-)/block.x,);

    rowAddKernel<<<grid, block, >>>(pIntegImgLena, pPtsImg, imgW, imgH);

    cudaThreadSynchronize();

     //按列求前缀和

    block=dim3(,);

    grid=dim3(,(imgH+block.y-)/block.y);

    colAddKernel<<<grid, block, >>>(pIntegImgLena, pPtsImg, imgW, imgH);

     cudaThreadSynchronize();

    //滤波

    int win=;

    block=dim3(,);

    grid=dim3((imgW+block.x-)/block.x, (imgH+block.y-)/block.y);

    filterKernel<<<grid, block, >>>(pImgLena,pIntegImgLena, pPtsImg, imgW, imgH, win);

    cudaThreadSynchronize();

    cudaMemcpy(filterLena.data, pImgLena, imgH*imgW*sizeof(uchar), cudaMemcpyDeviceToHost);

    cudaError err;

    err=cudaGetLastError();

    if (err!=cudaSuccess)

    {

        cout<<"err="<<err<<endl;

        getchar();

    }

    namedWindow("filterLena");

    imshow("filterLena", filterLena);

    waitKey();

    cudaFree(pImgLena);

    cudaFree(pIntegImgLena);

    cudaFree(pPtsImg);

}

积分图实现均值滤波的CUDA代码的更多相关文章

opencv-10-图像滤波-噪声添加与均值滤波-含opencv C++ 代码实现
开始之前再说上一篇文章中, 我们想按照噪声产生, 然后将降噪的, 但是限于篇幅, 我就放在这一篇里面了, 说起图像的噪声问题就又回到了我们上一章的内容, 把噪声当作信号处理, 实际上数字图像处理实际 ...
【AdaBoost算法】积分图代码实现
一.积分图介绍定义:图像左上方的像素点值的和: 在Adaboost算法中可用于加速计算Haar或MB-LBP特征值,如下图: 二.代码实现 #include <opencv/highgui.h ...
学习 opencv---(7) 线性邻域滤波专场：方框滤波，均值滤波，高斯滤波
本篇文章中,我们一起仔细探讨了OpenCV图像处理技术中比较热门的图像滤波操作.图像滤波系列文章浅墨准备花两次更新的时间来讲,此为上篇,为大家剖析了"方框滤波","均值滤 ...
滤波器——BoxBlur均值滤波及其快速实现
个人博客地址:滤波器--BoxBlur均值滤波及其快速实现动机:卷积核.滤波器.卷积.相关在数字图像处理的语境里,图像一般是二维或三维的矩阵,卷积核(kernel)和滤波器(filter)通常指代 ...
OpenCV计算机视觉学习（4）——图像平滑处理（均值滤波，高斯滤波，中值滤波，双边滤波）
如果需要处理的原图及代码,请移步小编的GitHub地址传送门:请点击我如果点击有误:https://github.com/LeBron-Jian/ComputerVisionPractice &q ...
基于FPGA的均值滤波算法实现
我们为了实现动态图像的滤波算法,用串口发送图像数据到FPGA开发板,经FPGA进行图像处理算法后,动态显示到VGA显示屏上,前面我们把硬件平台已经搭建完成了,后面我们将利用这个硬件基础平台上来实现基于 ...
基础图像处理之混合空间增强——(Java：拉普拉斯锐化、Sobel边缘检测、均值滤波、伽马变换)
相信看过冈萨雷斯第三版数字图像处理的童鞋都知道,里面涉及到了很多的基础图像处理的算法,今天,就专门借用其中一个混合空间增强的案例,来将常见的几种图像处理算法集合起来,看能发生什么样的化学反应首先,通 ...
基于MATLAB的均值滤波算法实现
在图像采集和生成中会不可避免的引入噪声,图像噪声是指存在于图像数据中的不必要的或多余的干扰信息,这对我们对图像信息的提取造成干扰,所以要进行去噪声处理,常见的去除噪声的方法有均值滤波.中值滤波.高斯滤 ...
浅析人脸检测之Haar分类器方法：Haar特征、积分图、 AdaBoost 、级联
浅析人脸检测之Haar分类器方法一.Haar分类器的前世今生人脸检测属于计算机视觉的范畴,早期人们的主要研究方向是人脸识别,即根据人脸来识别人物的身份,后来在复杂背景下的人脸检测需求越来越大,人脸 ...

随机推荐

C#　DataGridView 列的显示顺序
this.dataGridView1.Columns["列名"].DisplayIndex=Convert.ToInt32("你要放置的位置")
TCP/IP协议栈(三）——linux 向下的报文处理
应用程序连接服务器时,目的地套接字地址(端口号和IP地址)以参数形式传递给系统调用connect(tcp_v4_connect()).下面逐步介绍初始化该连接检查内核路由表,查找给定目的地IP地址路 ...
如何使用MOQ进行单元测试
使用MOQ来伪装和隔离被依赖对象,从而提高被测对象的测试效果. 安装通过http://code.google.com/p/moq可以下载MOQ的最新版本.在SSL项目中,我们使用的是MOQ 3.1. ...
HTML与HTML5复习标签汇总
按字母顺序排列 New : HTML5 中的新标签. 标签描述  定义注释. <!DOCTYPE> 定义文档类型. <a> 定义锚. < ...
HTML + CSS短标题（二，三，四文字长度）两端对齐的方式
今天切图碰到了一个看似好弄,却并不好弄的文本两端对齐问题.如图1-1
js 客户端打印html 并且去掉页眉、页脚
print() 方法用于打印当前窗口的内容,支持部分或者整个网页打印. 调用 print() 方法所引发的行为就像用户单击浏览器的打印按钮.通常,这会产生一个对话框,让用户可以取消或定制打印请求. w ...
[Spark内核] 第36课：TaskScheduler内幕天机解密：Spark shell案例运行日志详解、TaskScheduler和SchedulerBackend、FIFO与FAIR、Task运行时本地性算法详解等
本課主題通过 Spark-shell 窥探程序运行时的状况 TaskScheduler 与 SchedulerBackend 之间的关系 FIFO 与 FAIR 两种调度模式彻底解密 Task 数据 ...
【最短路·差分约束】洛谷P1250
题目描述一条街的一边有几座房子.因为环保原因居民想要在路边种些树.路边的地区被分割成块,并被编号成1..N.每个部分为一个单位尺寸大小并最多可种一棵树.每个居民想在门前种些树并指定了三个号码B,E, ...
Jerry 2017年的五一小长假：8种经典排序算法的ABAP实现
2017年4月29日~5月1日,国际劳动节, 三天的小长假. 在国内,小长假往往是这样的: 然而我当时在戏称为"德村"(德国农村)的Walldorf出差并且住在Wiesloch, ...
解决mariadb grant ERROR 1045 (28000): Access denied for user
下面我们一起来看一篇解决mariadb grant ERROR 1045 (28000): Access denied for user问题,希望文章能够帮助到各位朋友. 用mariadb也有一段 ...

积分图实现均值滤波的CUDA代码

积分图实现均值滤波的CUDA代码的更多相关文章

随机推荐

热门专题