【短道速滑十一】标准的Gabor滤波器及Log_Gabor滤波器的实现、解析、速度优化及其和Halcon中gen

　　最近有朋友在研究Halcon中gen_gabor的函数，和我探讨，因为我之前也没有怎么去关注这个函数，因此，前前后后大概也折腾了有一个星期去模拟实现这个东西，虽然最终没有实现这个函数，但是也是有所收获，这里做一点总结，也算是最这个函数有个完美的收尾吧。

　　1、Gabor滤波器

　　首先总是度娘出场，关键词Gabor滤波器，一大堆东西出来了，里面最多的肯定是关于OpenCv的getGaborKernel函数，这个函数的具体代码如下：

/*

 Gabor filters and such. To be greatly extended to have full texture analysis.

 For the formulas and the explanation of the parameters see:

 http://en.wikipedia.org/wiki/Gabor_filter

*/

cv::Mat cv::getGaborKernel( Size ksize, double sigma, double theta,

                            double lambd, double gamma, double psi, int ktype )

{

    double sigma_x = sigma;

    double sigma_y = sigma/gamma;

    int nstds = 3;

    int xmin, xmax, ymin, ymax;

    double c = cos(theta), s = sin(theta);

    if( ksize.width > 0 )

        xmax = ksize.width/2;

    else

        xmax = cvRound(std::max(fabs(nstds*sigma_x*c), fabs(nstds*sigma_y*s)));

    if( ksize.height > 0 )

        ymax = ksize.height/2;

    else

        ymax = cvRound(std::max(fabs(nstds*sigma_x*s), fabs(nstds*sigma_y*c)));

    xmin = -xmax;

    ymin = -ymax;

    CV_Assert( ktype == CV_32F || ktype == CV_64F );

    Mat kernel(ymax - ymin + 1, xmax - xmin + 1, ktype);

    double scale = 1;

    double ex = -0.5/(sigma_x*sigma_x);

    double ey = -0.5/(sigma_y*sigma_y);

    double cscale = CV_PI*2/lambd;

    for( int y = ymin; y <= ymax; y++ )

        for( int x = xmin; x <= xmax; x++ )

        {

            double xr = x*c + y*s;

            double yr = -x*s + y*c;

            double v = scale*std::exp(ex*xr*xr + ey*yr*yr)*cos(cscale*xr + psi);

            if( ktype == CV_32F )

                kernel.at<float>(ymax - y, xmax - x) = (float)v;

            else

                kernel.at<double>(ymax - y, xmax - x) = v;

        }

    return kernel;

}

　　可以快速看出，这段代码仅仅是根据一些参数计算出一个卷积核，具体的公式我也没怎么关注，里面有个nstds 这个常量为3，这个只在用户输入的ksize尺寸为0的时候需要用到，感觉是和高斯核函数在半径大于3*Sigma后其对结果的贡献就可以忽略不计有关。

　　这个函数生成的卷积核的形状和参数之间的关系，很多文章都有探讨，这个不是本文的重点，比如下面这个链接：https://blog.csdn.net/Wslsdx/article/details/110728050

　　基本上，在空域他的形状就是一些有间隔的白色过度条，在频域，则基本为两处白色亮点，如下图所示：

　　　　　　卷积核空域图形化　　　　　　　　　　　　　　　对应的频域图

　　通常，CV的getGaborKernel函数都要配合Filter2D函数进行卷积得到想要的结果。

　　网络上一个有意思的视觉效果方面的算法在https://zhuanlan.zhihu.com/p/584907623有提到，可以用这个滤波器来做一些特效。

static std::vector<cv::Mat> build_filters()

{

    std::vector<cv::Mat> filters;

    const int ksize = 31;

    const double sigma = 4.0;

    const double lambd = 10.0;

    const double gamma = 0.5;

    const double psi = 0;

    // 此处创建16个滤波器， 只有 getGaborkernel 的第三个参数 theta 不同

    for (int i = 0; i < 16; i++)

    {

        double theta = CV_PI * i / 16;

        cv::Mat kernel = cv::getGaborKernel(cv::Size(ksize, ksize), sigma, theta, lambd, gamma, psi, CV_32F);

        kernel /= 1.5 * cv::sum(kernel)[0];

        filters.emplace_back(kernel);

    }

    return filters;

}

cv::Mat process(const cv::Mat& src, std::vector<cv::Mat>& filters)

{

    cv::Mat accum = cv::Mat::zeros(src.size(), src.type());

    for (cv::Mat kernel: filters)

    {

        cv::Mat fimg;

        AutoTimer timer("filter2D");

        cv::filter2D(src, fimg, CV_8UC3, kernel); // 这里是耗时的瓶颈

        AutoTimer timer("getmax");

        accum = cv::max(accum, fimg);

    }

    return accum;

}

int main()

{

    cv::Mat src = cv::imread(image_path);

    std::vector<cv::Mat> filters = build_filters();

    cv::Mat res = process(src, filters);

}

　　、

　　这里用了16个滤波器组合求最大值，得到了一种特征线条凸出的效果。

　　当然，OpenCv的这个滤波器在一些特征识别方面也有着很大的作用，比如斑马线识别等等。

　　但是，测试发现这个滤波器对参数的配置极其敏感，同一个参数，一般两个值如果只相差一点点，一般出来的效果不会有太大的区别，但是这个函数，确可能会出现极大的差异。比如波长这个参数，当为0.4和0.5的结果大相径庭。　

　　　　　　　　　　　　　　　　波长为0.4时的结果　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　波长为0.5时的结果

　　仔细的分析这个问题，我们会发现，这个还是由于当参数改变时，这个滤波器的权重会出现波动，一般这些卷积核都需要归一化或做相关处理，当波长为0.5时，我们会发现归一化时，所有滤波器的和可能为负数或者很小的数，而为0.4时则较为正常。因此，出现了参数改变一点点，结果改变一大串的问题。

　　再稍微撤远一点，当我自己实现这个函数时，我们会发现他的主要耗时还是Filter2D函数，关于这个函数，OpenCV内部是做了优化的，他会根据硬件的支持情况使用opencl/ipp等加速资源实现，速度是相当的快，而且也会对核的大小做判断，很小的核不会使用FFT。我这里直接使用FFT做的实现，虽然我在进行FFT卷积时做了很多优化，比如拆解为多个256*256的FFT，比如充分利用虚部的数据等等，结果还是干不过Opencv的速度。

　　二、LogGabor滤波器

　　拿OpenCv的Gabor滤波器和Halcon的gen_gabor相比，发现他们根本不是一回事，gen_gabor直接生成了频域的数据，而不是生成了卷积核。关于这个算子，我们发现halcon里的描述也不是特别的清晰，这有点不太像他的风格。

　　百度搜索gen_gabor我们能发现的99%的资料都是halcon帮助文档的英文原版或者是相关翻译，基本没有对其进行原理进行描述。可能也是因为这个算子不是很常用的原因吧。

　　在搜索Gabor滤波器时，也看到了一些文章讲LogGabor滤波器，其中有一篇文章有提到 Log-Gabor函数并不能在空间域中得到表达式，滤波器的构造须在频域中进行，这个和gen_gabor的描述非常相似。后面我们对其参数进行了一些分析，基本可以确定halcon的gabor应该是类似于LogGabor滤波器之类的。

　　通过搜索LogGabor，我们得到了一下几个比较有用的参考链接和代码：

　　　Python OpenCV实现Log Gabor滤波器（由LGHD描述符扩展）以及 Github中一篇 PhaseCongruency/gaborconvolve.m的matlab代码

　　还有一个非常有用的图片：

　　通过阅读这几篇文章及其配套的代码，我们发现这个频域的滤波器可由Log-Radial Gaussian和Angular Gaussian组合而成，在Python那篇文章中，则有这更为明确的公式：

　　原文描述如下：

　　　　　　一个二维的L-Gaborj波器可以分解为径向滤波器和角度滤波器两部分，对应极坐标公式为:

　　　　　　完整的Log-Gabor滤波器由这两部分相乘得到:

　　这个公式也和上面的图片能完全对应。

　　在代码实现上，我发现无损是Python的代码还是matlab的代码其实都是一个版本的，他们在计算有关的过程中都有一个lowpass的过程，我不清楚那个是目的是啥，也不知道哪里的参数来源依据是什么，但是我感觉他们不应该是我所需要的，我需要的就是上面两个公式，结合那些参考代码，我们对第一个公式（径向滤波器）的M代码实现如下：

WaveLength = 10;

SigmaR = 0.4;

cols = 500, rows=500;

[x,y] = meshgrid( [-cols/2:(cols/2-1)]/cols,[-rows/2:(rows/2-1)]/rows);

radius = sqrt(x.^2 + y.^2);

Frequency = 1.0 / WaveLength;                  % 频率等于波长的导数

logGabor = exp((-(log(radius / Frequency)).^2) / (2 * SigmaR * SigmaR));  % log gabor函数的传递函数表达式

imshow(logGabor,[])

　　对第二个公式的实现代码如下：

Angle = 45 / 180 *3.1415926;

SigmaA = 0.4;

cols = 500, rows=500;

[x,y] = meshgrid( [-cols/2:(cols/2-1)]/cols,[-rows/2:(rows/2-1)]/rows);

theta = atan2(-y,x);

sintheta = sin(theta);

costheta = cos(theta);

ds = sintheta * cos(Angle) - costheta * sin(Angle);

dc = costheta * cos(Angle) + sintheta * sin(Angle);

dtheta = atan2(abs(ds),abs(dc));

spread = exp((-dtheta.^2) / (2 * SigmaA * SigmaA));

imshow(spread,[])

　　当将两者组合起来后，即产生如下的代码：

WaveLength = 10;

SigmaR = 0.4;

Angle = 45 / 180 *3.1415926;

SigmaA = 0.4;

cols = 500, rows=500;

[x,y] = meshgrid( [-cols/2:(cols/2-1)]/cols,[-rows/2:(rows/2-1)]/rows);

radius = sqrt(x.^2 + y.^2);

Frequency = 1.0 / WaveLength;                  % 频率等于波长的导数

logGabor = exp((-(log(radius / Frequency)).^2) / (2 * SigmaR * SigmaR));  % log gabor函数的传递函数表达式

theta = atan2(-y,x);

sintheta = sin(theta);

costheta = cos(theta);

ds = sintheta * cos(Angle) - costheta * sin(Angle);

dc = costheta * cos(Angle) + sintheta * sin(Angle);

dtheta = atan2(abs(ds),abs(dc));

spread = exp((-dtheta.^2) / (2 * SigmaA * SigmaA));

imshow(logGabor .* spread,[])

　　三段代码产生的图像依次如下所示：

　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　WaveLength = 10，SigmaR = 0.4，Angle = 45 / 180 *3.1415926， SigmaA = 0.4;

　　通过改变参数可以获得不同的效果，比如，WaveLength = 5，SigmaR = 0.05，Angle = 30 / 180 *3.1415926， SigmaA = 0.3时的效果如下：

　　注意到，相比于原始的代码，我们在计算dtheta时，稍微做了修改，这是因为，频域的数据一般是要求堆成的，而原始的角向滤波器是非对称的，因此，我们改成了atan2(abs(ds),abs(dc));

　　这个生成的过程里有很多浮点的计算，而且有几个复杂度比较高的函数，因此，计算还是有所耗时的。

　　我们来和halcon的gen_gabor的参数做下比较：

　　　　　　　　gen_gabor( : ImageFilter : Angle, Frequency, Bandwidth, Orientation, Norm, Mode, Width, Height : )

　　后面Norm, Mode, Width, Height 这四个参数不用管它，我们主要看看前面四个参数。

　　注意到我们刚才的代码里也提供了四个可选的参数，即WaveLength，SigmaR，Angle， SigmaA，那他们之间有么有什么对应的关系呢。

　　通过多次比较和测试，我们可以定性的确定如下联系：

　　1、gen_gabor里的Orientation和我的LogGabor里的Angle基本是一个意思，这个可以从Orientation的范围可以看到，就是个角度范围：

　　　　　Orientation (input_control) real → (real)
　　　　　　　　Angle of the principal orientation，Suggested values: 0.0, 0.2, 0.4, 0.6, 0.8, 1.0, 1.2, 1.4, 1.6, 1.8, 2.0, 2.2, 2.4, 2.6, 2.8, 3.0, 3.14

　 2、gen_gabor的Bandwidth和LogGabor的SigmaR的趋势基本是一致的。

3、gen_gabor的Frequency和LogGabor的WaveLength的趋势基本是相反的，但是WaveLength本身就是Frenquency的倒数，都是会随着Frequency的变小，频域的有效部分想中心收缩。

4、gen_gabor的Angle和LogGabor的SigmaA的趋势基本是相反的。

　　也就是说这4个参数基本上都存在一一对应的关系，只是说我们无法确认他们之间的绝对值之间的联系，毕竟halcon里也没有提供具体的计算式，只要稍微某个地方有些取值不同，就会造成不同的结果。

　　由于loggabor提供的已经是频域的数据了，因此，后续的计算就比较简单了，因为频域的乘法就相当于于时域的卷积，因此，直接把某个图像的频域数据乘以这个LogGabor数据就可以了。

但是，这就要求LogGabor的数据维度必须和图像是一样大小的，其实这个有个隐藏的问题，即边缘问题，因为卷积对于边缘一般来说是需要扩展的，否则会遇到一些小小意料之外的问题。

　　做了一个简单的比较，当gen_gabor和LogGabor滤波器的可视化图基本类似时，大部分情况两者之间的效果似乎方向是一致的。

　　　　　　　　　　　　halcon的gen_gabor可视化结果　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　对应的滤波器输出

　　　　　LogGabor参数　　　　　　　　　　　　　　　　　　　　　　　　　　　　LogGabor可视化结果　　　　　　　　　　　　　　　　　　　　　　　　　　　　对应的滤波器结果

　　上述结果的halcon代码如下所示：

read_image (Image, 'fabrik')

get_image_size (Image, Width, Height)

gen_gabor(Filter,10,0.1,50,1.57,'n','dc_center',Width, Height)

fft_generic(Image,ImageFFT,'to_freq',-1,'none','dc_center','complex')

convol_gabor(ImageFFT,Filter,Gabor,Hilbert)

fft_generic(Gabor,GaborInv,'from_freq',1,'none','dc_center','byte')

　　可以看出，两者的结果存在一定的相似性，从某个侧面说明我们的猜测具有一定的科学性。

　　三、速度优化

　　从上面的过程可以看到我们的LogGabor滤波器的生成有着较为复杂的计算公式，而且有多个函数调用，这些函数其实都是有着较为复杂的内部计算的，要进行优化，可以从多方面出发，第一个是用C语言处理吧，把一些公共的计算放到循环外部，把能优化掉的除法尽量改为乘法，还可以把那个exp的计算合并为一个，因为我们知道exp(a) * exp(b) = exp(a+b)，这样就可以减少一次exp计算了。

　　当然，我们还可以进行指令集优化，我们可以自定义_mm_atan2_ps, _mm_sincos_ps, _mm_exp_ps等等指令集函数（网络上可以找到的），他们可以接受成吨的输出。很爽，至少速度比C版本的提高3到4倍。

　　我们在计算频域相乘时，也可以适当的考虑扩大图像，让图像的尺寸变为那些更有利于做FFT变换的数据，比如4、5、8的倍数等等，这样，可以有效地提高FFT的运算速度，并且对结果只会造成轻微的影响。

　　关于这个算法目前就研究这么多吧，希望能造福有需要的人，也能造福自己。

　　此更新算法位于我的SSE Demo的如下目录： Detection(检测相关）---》Gabor Filter(Gabor滤波)。

　　SSE Demo下载地址： https://files.cnblogs.com/files/Imageshop/SSE_Optimization_Demo.rar

　　如果想时刻关注本人的最新文章，也可关注公众号或者添加本人微信： laviewpbt

翻译

搜索

复制

【短道速滑十一】标准的Gabor滤波器及Log_Gabor滤波器的实现、解析、速度优化及其和Halcon中gen_gabor的比较。的更多相关文章

FIR滤波器和IIR滤波器的区别
数字滤波器广泛应用于硬件电路设计,在离散系统中尤为常见,一般可以分为FIR滤波器和IIR滤波器,那么他们有什么区别和联系呢. FIR滤波器定义: FIR滤波器是有限长单位冲激响应滤波器,又称为非递归 ...
【短道速滑一】OpenCV中cvResize函数使用双线性插值缩小图像到长宽大小一半时速度飞快（比最近邻还快）之异象解析和自我实现。
今天,一个朋友想使用我的SSE优化Demo里的双线性插值算法,他已经在项目里使用了OpenCV,因此,我就建议他直接使用OpenCV,朋友的程序非常注意效率和实时性(因为是处理视频),因此希望我能测试 ...
【短道速滑九】仿halcon中gauss_filter小半径高斯模糊优化的实现
通常,我们谈的高斯模糊,都知道其是可以行列分离的算法,现在也有着各种优化算法实现,而且其速度基本是和参数大小无关的.但是,在我们实际的应用中,我们可能会发现,有至少50%以上的场景中,我们并不需要大半 ...
IIR滤波器和FIR滤波器的区别与联系zz
-------------------------------------------------------------------------------------------------- ...
FIR滤波器与IIR滤波器
FIR(Finite Impulse Response)滤波器有限长单位冲激响应滤波器,又称为非递归型滤波器特点: FIR滤波器的最主要的特点是没有反馈回路,稳定性强,故不存在不稳定的问题: FI ...
标准格式包含: 私有属性无参构造有参构造 setter 和getter 需求中的方法需求一：员工类Employee 属性：姓名name,工号id,工资salary 行为：显示所有成员信息的方法show() 需求二：动物类Animal 属性:姓名name,年龄age 行为:吃饭
// 员工类 public class Employee { private String name; private int id; private double salary; public ...
设计模式(三十一)----综合应用-自定义Spring框架-自定义Spring IOC-定义解析器、IOC容器相关类
3 定义解析器相关类 3.1 BeanDefinitionReader接口 BeanDefinitionReader是用来解析配置文件并在注册表中注册bean的信息.定义了两个规范: 获取注册表的功能 ...
iOS 底层框架的浅析
1.简介 IOS是由苹果公司为iPhone.iPod touch和iPad等设备开发的操作系统. 2.知识点 iPhone OS(现在叫iOS)是iPhone, iPod touch 和 iPad 设 ...
IOS计划分析
1.基本介绍 IOS苹果公司iPhone.iPod touch和iPad操作系统和其他设备的发展. 2.知识点 1.IOS系统 iPhone OS(现在所谓的iOS)这是iPhone, iPod to ...
超越halcon速度的二值图像的腐蚀和膨胀，实现目前最快的半径相关类算法（附核心源码）。
我在两年前的博客里曾经写过 SSE图像算法优化系列七:基于SSE实现的极速的矩形核腐蚀和膨胀(最大值和最小值)算法一文,通过SSE的优化把矩形核心的腐蚀和膨胀做到了不仅和半径无关,而且速度也相当的 ...

随机推荐

1.6 编写双管道ShellCode后门
本文将介绍如何将CMD绑定到双向管道上,这是一种常用的黑客反弹技巧,可以让用户在命令行界面下与其他程序进行交互,我们将从创建管道.启动进程.传输数据等方面对这个功能进行详细讲解.此外,本文还将通过使用 ...
【Spring boot】 @Value注解
一.不通过配置文件的注入属性 1.1 注入普通字符串直接附在属性名上,在 Bean 初始化时,会赋初始值 @Value("normal") private String norm ...
【环境搭建】多版本的jdk共存
问题来源 burpsuite 2021需要使用Java 9及以上版本,而其他工具需要Java 8,因此需要两个版本共存,并且做到除了burpsuite以外的工具默认使用Java 8打开. 需要的软件 ...
GoFrame v2.5 版本发布，企业级 Golang 开发框架
大家好啊,GoFrame 框架今天发布了 v2.5.0 正式版本啦! 本次版本主要是对已有功能组件以及开发工具上的改进工作.其中,开发工具新增了 gf gen ctrl 命令,以规范化定义.开发 AP ...
CSS: 绝对定位fixed
属性介绍元素会被移出正常文档流,并不为元素预留空间,而是通过指定元素相对于屏幕视口(viewport)的位置来指定元素位置.元素的位置在屏幕滚动时不会改变.打印时,元素会出现在的每页的固定位置.fi ...
C#/.NET/.NET Core优秀项目和框架每周精选（坑已挖，欢迎大家踊跃提交PR或者Issues中留言）
前言注意:排名不分先后,都是十分优秀的开源项目和框架,每周定期更新分享(欢迎关注公众号:追逐时光者,第一时间获取每周精选分享资讯). 每周精选优秀的C#/.NET/.NET Core项目和框架,帮助 ...
从原理聊JVM（四）：JVM中的方法调用原理
1 引言多态是Java语言极为重要的一个特性,可以说是Java语言动态性的根本,那么线程执行一个方法时到底在内存中经历了什么,JVM又是如何确定方法执行版本的呢? 2 栈帧 JVM中由栈帧存储方法的 ...
Android Studio Giraffe安装与gradle配置
本机环境:win10专业版,64位,16G内存. 原先用的AS2.2,是很早之前在看<第一行代码Android(第2版)>的时候,按书里的链接下载安装的,也不用怎么配置.(PS:第一行代码 ...
Docker从入门到部署项目
Docker概念 Docker是一个开源的应用容器引擎,它是基于Go语言并遵从Apache2.0协议开源.Docker可以让开发者打包他们的应用以及依赖包到一个轻量级.可移植的容器中,然后发布到任何流 ...
aspnetcore 注册中心 consul
consul启动 . http://192.168.1.6:8500/ #以server方式启动,UI可以访问,boot引导自己选为leader,网段内PC可访问 consul agent -serv ...

【短道速滑十一】标准的Gabor滤波器及Log_Gabor滤波器的实现、解析、速度优化及其和Halcon中gen_gabor的比较。

【短道速滑十一】标准的Gabor滤波器及Log_Gabor滤波器的实现、解析、速度优化及其和Halcon中gen_gabor的比较。的更多相关文章

随机推荐

热门专题