MATLAB conv2卷积的实现

二维卷积的算法原理比较简单,参考任意一本数字信号处理的书籍,而matlab的conv2函数的滤波有个形状参数,用下面的一张图很能说明问题:

这里给出一种最原始的实现方案。这种实现对于数据矩阵大小为1000x1000,卷积核矩阵大小为20x20,在我的机器上需要大约1秒钟的时间,而matlab采用的MKL库最快只需要将近0.1s的时间。下面的代码用到了自己目前开发的FastIV中的一些函数接口。具体代码如下:

  1. #include "fiv_core.h"
  2. typedef enum{
  3. FIV_CONV2_SHAPE_FULL,
  4. FIV_CONV2_SHAPE_SAME,
  5. FIV_CONV2_SHAPE_VALID
  6. }FIV_CONV_SHAPE;
  7. void fIv_conv2(fIvMat** dst_mat, fIvMat* src_mat, fIvMat* kernel_mat, FIV_CONV_SHAPE shape)
  8. {
  9. int src_row = src_mat->rows;
  10. int src_cols = src_mat->cols;
  11. int kernel_row = kernel_mat->rows;
  12. int kernel_cols = kernel_mat->cols;
  13. int dst_row = 0, dst_cols = 0, edge_row = 0, edge_cols = 0;
  14. int i,j, kernel_i,kernel_j,src_i,src_j;
  15. fIvMat* ptr_dst_mat = NULL;
  16. switch(shape){
  17. case FIV_CONV2_SHAPE_FULL:
  18. dst_row = src_row + kernel_row - 1;
  19. dst_cols = src_cols + kernel_cols - 1;
  20. edge_row = kernel_row - 1;
  21. edge_cols = kernel_cols - 1;
  22. break;
  23. case FIV_CONV2_SHAPE_SAME:
  24. dst_row = src_row;
  25. dst_cols = src_cols;
  26. edge_row = (kernel_row - 1) / 2;
  27. edge_cols = (kernel_cols - 1) / 2;
  28. break;
  29. case FIV_CONV2_SHAPE_VALID:
  30. dst_row = src_row - kernel_row + 1;
  31. dst_cols = src_cols - kernel_cols + 1;
  32. edge_row = edge_cols = 0;
  33. break;
  34. }
  35. ptr_dst_mat = fIv_create_mat(dst_row, dst_cols, FIV_64FC1);
  36. *dst_mat = ptr_dst_mat;
  37. for (i = 0; i < dst_row; i++) {
  38. ivf64* ptr_dst_line_i = (ivf64* )fIv_get_mat_data_at_row(ptr_dst_mat, i);
  39. for (j = 0; j < dst_cols; j++) {
  40. ivf64 sum = 0;
  41. kernel_i = kernel_row - 1 - FIV_MAX(0, edge_row - i);
  42. src_i = FIV_MAX(0, i - edge_row);
  43. for (; kernel_i >= 0 && src_i < src_row; kernel_i--, src_i++) {
  44. ivf64* ptr_src_line_i,*ptr_kernel_line_i;
  45. kernel_j = kernel_cols - 1 - FIV_MAX(0, edge_cols - j);
  46. src_j = FIV_MAX(0, j - edge_cols);
  47. ptr_src_line_i = (ivf64*)fIv_get_mat_data_at_row(src_mat, src_i);
  48. ptr_kernel_line_i = (ivf64*)fIv_get_mat_data_at_row(kernel_mat, kernel_i);
  49. ptr_src_line_i += src_j;
  50. ptr_kernel_line_i += kernel_j;
  51. for (; kernel_j >= 0 && src_j < src_cols; kernel_j--, src_j++){
  52. sum += *ptr_src_line_i++ * *ptr_kernel_line_i--;
  53. }
  54. }
  55. ptr_dst_line_i[j] = sum;
  56. }
  57. }
  58. }
  59. FIV_ALIGNED(16) ivf64 ker_data[4*4] = {0.1,0.2,0.3,0.4,
  60. 0.5,0.6,0.7,0.8,
  61. 0.9,1.0,1.1,1.2,
  62. 1.3,1.4,1.5,1.6};
  63. void test_conv2()
  64. {
  65. fIvMat* src_mat = fIv_create_mat_magic(8, FIV_64FC1); // 8x8 magic matrix
  66. fIvMat* kernel_mat = fIv_create_mat_header(4, 4, FIV_64FC1);
  67. fIvMat* dst_mat = NULL;
  68. fIv_set_mat_data(kernel_mat, ker_data, (sizeof(ivf64)) * 4 * 4);
  69. fIv_conv2(&dst_mat, src_mat, kernel_mat, FIV_CONV2_SHAPE_FULL);
  70. fIv_export_matrix_data_file(dst_mat,"dst_mat_4x4-full.txt", 1);
  71. fIv_release_mat(&src_mat);
  72. fIv_release_mat(&kernel_mat);
  73. fIv_release_mat(&dst_mat);
  74. }
  75. int main()
  76. {
  77. test_conv2();
  78. return 0;
  79. }

10月24日更新:

目前FastIV中的实现已经经过优化,最快速度在我的机器上已经超越MATLAB。

MATLAB conv2卷积的实现的更多相关文章

  1. 关于matlab矩阵卷积conv2和傅里叶变换求卷积ifft2的关系

    先定义两个矩阵 a = [1 2 3 5 ; 4 7 9 5;1 4 6 7;5 4 3 7;8 7 5 1] %a矩阵取5*4 b = [1 5 4; 3 6 8; 1 5 7]   %b矩阵如多数 ...

  2. Matlab 矩阵卷积理解(转载)

    转载自:http://blog.csdn.net/andrewseu/article/details/51783181 在图像处理的过程中,经常会看到矩阵卷积的概念,比如说用一个模板去和一张图片进行卷 ...

  3. 【转】MATLAB conv2函数的理解

    另附:http://blog.csdn.net/anan1205/article/details/12313593 原文:http://blog.csdn.net/andrewseu/article/ ...

  4. matlab中卷积convolution与filter用法

    转自:https://blog.csdn.net/dkcgx/article/details/46652021 转自:https://blog.csdn.net/Reborn_Lee/article/ ...

  5. matlab中卷积编码参数的理解

    poly2trellis(7, [171 133])代表什么意思呢?首先是7,他是1*k的vector,此处k为1,[171 133]是k*n的vector,此处n就是2,那么这个编码就是1/2码率的 ...

  6. 连载 3:利用 matlab计算卷积

  7. MATLAB filter2/conv2 函数在 Python 语言中的等价函数

    MATLAB filter2 和 conv2 函数说明 在 MATLAB 中,filter2 函数实现二维数字滤波器.conv2 函数实现二维卷积. filter2(H, X, mode) 等价于 c ...

  8. Deep Learning论文笔记之(四)CNN卷积神经网络推导和实现(转)

    Deep Learning论文笔记之(四)CNN卷积神经网络推导和实现 zouxy09@qq.com http://blog.csdn.net/zouxy09          自己平时看了一些论文, ...

  9. (原+转)使用opencv的DFT计算卷积

    转载请注明出处: http://www.cnblogs.com/darkknightzh/p/5462665.html 参考网址: http://blog.csdn.net/lichengyu/art ...

随机推荐

  1. Nginx/LVS/HAProxy负载均衡软件的优缺点详解(转)

    PS:Nginx/LVS/HAProxy是目前使用最广泛的三种负载均衡软件,本人都在多个项目中实施过,参考了一些资料,结合自己的一些使用经验,总结一下. 一般对负载均衡的使用是随着网站规模的提升根据不 ...

  2. 从源码角度深入理解Toast

    Toast这个东西我们在开发中经常用到,使用也很简单,一行代码就能搞定: 1: Toast.makeText(", Toast.LENGTH_LONG).show(); 但是我们经常会遇到这 ...

  3. Thumb

    这个控件,真不好介绍,MSDN上也是草草几句,反正就是可以让用户拖动的玩意儿,但是,你会发现,当你在该控件上拖动时,它没有反响,也就是说这个东西默认不做任何操作的,它是赖在那里什么都不干,除非你去踢上 ...

  4. samba服务器与远程登录ssh

    作者:相思羽  出处:http://www.cnblogs.com/xiang-siyu 欢迎转载,也请保留这段声明.谢谢! deepin安装与配置samba服务器 安装  apt-get insta ...

  5. HttpClient4.4 进行Http连接通讯

    以前一直使用jdk自带的urlConnection来进行http通讯,HttpClient与之相比,HttpClient更具有灵活度和易用性.HttpClient能够方便使用连接池,使用时需要重新创建 ...

  6. ArcGIS Server JavaScript API 各命名空间的含义【转】

    1.esri 命名空间      所有的对象都是在 esri 命名空间下的,esri 有自己的属性和方法.      如 esri.version 返回当前 JavaScript API 的版本号.e ...

  7. BFM1

    BFM应该描述的是具有某种具体功能的电路.比如说,你的待测电路是一个智能卡,那他的BFM就是读卡器:那你就要根据协议,在BFM中描述出读卡器的具体行为. 写BFM就类似于写testbench了.BFM ...

  8. SharePoint 文档库实现文件夹拖放到文档库

    打开文档库-> 选择文件夹-> 在Ribbon中选择“库(list)”-> 在右边可以看到打开方式-> 选择用资源管理器打开-> 在新打开的资源管理器中可能实现对文夹的拖 ...

  9. 利用php给图片添加文字水印--面向对象与面向过程俩种方法的实现

    1: 面向过程的编写方法 //指定图片路径 $src = '001.png'; //获取图片信息 $info = getimagesize($src); //获取图片扩展名 $type = image ...

  10. Windows 7中,用Visual Studio开发WPF应用程序,实现从Windows Explorer中拖拽文件到应用程序,始终显示“无法拖放”符号问题解决方案

    Are you running your application or Visual Studio that hosts the app under administrative privilege? ...