MATLAB conv2卷积的实现
二维卷积的算法原理比较简单,参考任意一本数字信号处理的书籍,而matlab的conv2函数的滤波有个形状参数,用下面的一张图很能说明问题:
这里给出一种最原始的实现方案。这种实现对于数据矩阵大小为1000x1000,卷积核矩阵大小为20x20,在我的机器上需要大约1秒钟的时间,而matlab采用的MKL库最快只需要将近0.1s的时间。下面的代码用到了自己目前开发的FastIV中的一些函数接口。具体代码如下:
- #include "fiv_core.h"
- typedef enum{
- FIV_CONV2_SHAPE_FULL,
- FIV_CONV2_SHAPE_SAME,
- FIV_CONV2_SHAPE_VALID
- }FIV_CONV_SHAPE;
- void fIv_conv2(fIvMat** dst_mat, fIvMat* src_mat, fIvMat* kernel_mat, FIV_CONV_SHAPE shape)
- {
- int src_row = src_mat->rows;
- int src_cols = src_mat->cols;
- int kernel_row = kernel_mat->rows;
- int kernel_cols = kernel_mat->cols;
- int dst_row = 0, dst_cols = 0, edge_row = 0, edge_cols = 0;
- int i,j, kernel_i,kernel_j,src_i,src_j;
- fIvMat* ptr_dst_mat = NULL;
- switch(shape){
- case FIV_CONV2_SHAPE_FULL:
- dst_row = src_row + kernel_row - 1;
- dst_cols = src_cols + kernel_cols - 1;
- edge_row = kernel_row - 1;
- edge_cols = kernel_cols - 1;
- break;
- case FIV_CONV2_SHAPE_SAME:
- dst_row = src_row;
- dst_cols = src_cols;
- edge_row = (kernel_row - 1) / 2;
- edge_cols = (kernel_cols - 1) / 2;
- break;
- case FIV_CONV2_SHAPE_VALID:
- dst_row = src_row - kernel_row + 1;
- dst_cols = src_cols - kernel_cols + 1;
- edge_row = edge_cols = 0;
- break;
- }
- ptr_dst_mat = fIv_create_mat(dst_row, dst_cols, FIV_64FC1);
- *dst_mat = ptr_dst_mat;
- for (i = 0; i < dst_row; i++) {
- ivf64* ptr_dst_line_i = (ivf64* )fIv_get_mat_data_at_row(ptr_dst_mat, i);
- for (j = 0; j < dst_cols; j++) {
- ivf64 sum = 0;
- kernel_i = kernel_row - 1 - FIV_MAX(0, edge_row - i);
- src_i = FIV_MAX(0, i - edge_row);
- for (; kernel_i >= 0 && src_i < src_row; kernel_i--, src_i++) {
- ivf64* ptr_src_line_i,*ptr_kernel_line_i;
- kernel_j = kernel_cols - 1 - FIV_MAX(0, edge_cols - j);
- src_j = FIV_MAX(0, j - edge_cols);
- ptr_src_line_i = (ivf64*)fIv_get_mat_data_at_row(src_mat, src_i);
- ptr_kernel_line_i = (ivf64*)fIv_get_mat_data_at_row(kernel_mat, kernel_i);
- ptr_src_line_i += src_j;
- ptr_kernel_line_i += kernel_j;
- for (; kernel_j >= 0 && src_j < src_cols; kernel_j--, src_j++){
- sum += *ptr_src_line_i++ * *ptr_kernel_line_i--;
- }
- }
- ptr_dst_line_i[j] = sum;
- }
- }
- }
- FIV_ALIGNED(16) ivf64 ker_data[4*4] = {0.1,0.2,0.3,0.4,
- 0.5,0.6,0.7,0.8,
- 0.9,1.0,1.1,1.2,
- 1.3,1.4,1.5,1.6};
- void test_conv2()
- {
- fIvMat* src_mat = fIv_create_mat_magic(8, FIV_64FC1); // 8x8 magic matrix
- fIvMat* kernel_mat = fIv_create_mat_header(4, 4, FIV_64FC1);
- fIvMat* dst_mat = NULL;
- fIv_set_mat_data(kernel_mat, ker_data, (sizeof(ivf64)) * 4 * 4);
- fIv_conv2(&dst_mat, src_mat, kernel_mat, FIV_CONV2_SHAPE_FULL);
- fIv_export_matrix_data_file(dst_mat,"dst_mat_4x4-full.txt", 1);
- fIv_release_mat(&src_mat);
- fIv_release_mat(&kernel_mat);
- fIv_release_mat(&dst_mat);
- }
- int main()
- {
- test_conv2();
- return 0;
- }
10月24日更新:
目前FastIV中的实现已经经过优化,最快速度在我的机器上已经超越MATLAB。
MATLAB conv2卷积的实现的更多相关文章
- 关于matlab矩阵卷积conv2和傅里叶变换求卷积ifft2的关系
先定义两个矩阵 a = [1 2 3 5 ; 4 7 9 5;1 4 6 7;5 4 3 7;8 7 5 1] %a矩阵取5*4 b = [1 5 4; 3 6 8; 1 5 7] %b矩阵如多数 ...
- Matlab 矩阵卷积理解(转载)
转载自:http://blog.csdn.net/andrewseu/article/details/51783181 在图像处理的过程中,经常会看到矩阵卷积的概念,比如说用一个模板去和一张图片进行卷 ...
- 【转】MATLAB conv2函数的理解
另附:http://blog.csdn.net/anan1205/article/details/12313593 原文:http://blog.csdn.net/andrewseu/article/ ...
- matlab中卷积convolution与filter用法
转自:https://blog.csdn.net/dkcgx/article/details/46652021 转自:https://blog.csdn.net/Reborn_Lee/article/ ...
- matlab中卷积编码参数的理解
poly2trellis(7, [171 133])代表什么意思呢?首先是7,他是1*k的vector,此处k为1,[171 133]是k*n的vector,此处n就是2,那么这个编码就是1/2码率的 ...
- 连载 3:利用 matlab计算卷积
- MATLAB filter2/conv2 函数在 Python 语言中的等价函数
MATLAB filter2 和 conv2 函数说明 在 MATLAB 中,filter2 函数实现二维数字滤波器.conv2 函数实现二维卷积. filter2(H, X, mode) 等价于 c ...
- Deep Learning论文笔记之(四)CNN卷积神经网络推导和实现(转)
Deep Learning论文笔记之(四)CNN卷积神经网络推导和实现 zouxy09@qq.com http://blog.csdn.net/zouxy09 自己平时看了一些论文, ...
- (原+转)使用opencv的DFT计算卷积
转载请注明出处: http://www.cnblogs.com/darkknightzh/p/5462665.html 参考网址: http://blog.csdn.net/lichengyu/art ...
随机推荐
- MyJFrame(文本)界面的建立
import java.awt.Color;import java.awt.Component;import java.awt.Container;import java.awt.FlowLayout ...
- iOS开发篇-申请开发者账号流程
1.注册一个苹果的apple id申请apple id的地址: https://appleid.apple.com/account 2.如申请公司账号,请使用以下链接免费获取邓白氏号码,以下的申请表格 ...
- 监控Linux内存使用情况
cat mem.sh#!/bin/bashIP=`ifconfig | grep 'inet ' | grep -v '127.0.0.1' | awk -F ' ' '{print $2}'| aw ...
- ie6的兼容总结
ie6的兼容处理总结 1.透明背景图: .timer { _filter: progid:DXImageTransform.Microsoft.AlphaImageLoader(src='my.png ...
- 练习题之ThreadLocal
public class ThreadLocalMain { private static ThreadLocal<Integer> value = new ThreadLocal< ...
- elasticsearch学习一、安装和配置
原文链接:http://jingyan.baidu.com/article/48206aead42b53216bd6b372.html ElasticSearch是一个基于Lucene的搜索服务器.它 ...
- Linux理念
1.小即是美 2.让程序只做好一件事 3.可移植性比效率更重要 4.一切即文件——使用方便而且吧硬件作为文件处理是安全的 5.使用shell脚本来提高效率和可移植性 6.避免使用可定制性低下的用户界面 ...
- php有三种工作模式
php有三种工作模式. 其中是最常见的是php作为一个模块工作在一个多进程的webserver中, 例如apache webserver. apache会启动一个主进程, 多个子进程(php). 主进 ...
- Sidebar Enhancements使用说明
SideBarEnhancements是Sublime侧栏文件与文件夹的增强工具 Version: 2015.5.27 通过使用Sumbime Text3安装包工具(Package Control,快 ...
- iOS开发——音频篇——音乐的播放
一.简单说明 音乐播放用到一个叫做AVAudioPlayer的类,这个类可以用于播放手机本地的音乐文件. 注意: (1)该类(AVAudioPlayer)只能用于播放本地音频. (2)时间比较短的(称 ...