最近有朋友在研究Halcon中gen_gabor的函数,和我探讨,因为我之前也没有怎么去关注这个函数,因此,前前后后大概也折腾了有一个星期去模拟实现这个东西,虽然最终没有实现这个函数,但是也是有所收获,这里做一点总结,也算是最这个函数有个完美的收尾吧。

  1、Gabor滤波器

  首先总是度娘出场,关键词Gabor滤波器,一大堆东西出来了,里面最多的肯定是关于OpenCv的getGaborKernel函数,这个函数的具体代码如下:

/*
Gabor filters and such. To be greatly extended to have full texture analysis.
For the formulas and the explanation of the parameters see:
http://en.wikipedia.org/wiki/Gabor_filter
*/
cv::Mat cv::getGaborKernel( Size ksize, double sigma, double theta,
double lambd, double gamma, double psi, int ktype )
{
double sigma_x = sigma;
double sigma_y = sigma/gamma;
int nstds = 3;
int xmin, xmax, ymin, ymax;
double c = cos(theta), s = sin(theta);
if( ksize.width > 0 )
xmax = ksize.width/2;
else
xmax = cvRound(std::max(fabs(nstds*sigma_x*c), fabs(nstds*sigma_y*s))); if( ksize.height > 0 )
ymax = ksize.height/2;
else
ymax = cvRound(std::max(fabs(nstds*sigma_x*s), fabs(nstds*sigma_y*c))); xmin = -xmax;
ymin = -ymax;
CV_Assert( ktype == CV_32F || ktype == CV_64F );
Mat kernel(ymax - ymin + 1, xmax - xmin + 1, ktype);
double scale = 1;
double ex = -0.5/(sigma_x*sigma_x);
double ey = -0.5/(sigma_y*sigma_y);
double cscale = CV_PI*2/lambd;
for( int y = ymin; y <= ymax; y++ )
for( int x = xmin; x <= xmax; x++ )
{
double xr = x*c + y*s;
double yr = -x*s + y*c; double v = scale*std::exp(ex*xr*xr + ey*yr*yr)*cos(cscale*xr + psi);
if( ktype == CV_32F )
kernel.at<float>(ymax - y, xmax - x) = (float)v;
else
kernel.at<double>(ymax - y, xmax - x) = v;
}
return kernel;
}

  可以快速看出,这段代码仅仅是根据一些参数计算出一个卷积核,具体的公式我也没怎么关注,里面有个nstds 这个常量为3,这个只在用户输入的ksize尺寸为0的时候需要用到,感觉是和高斯核函数在半径大于3*Sigma后其对结果的贡献就可以忽略不计有关。

  这个函数生成的卷积核的形状和参数之间的关系,很多文章都有探讨,这个不是本文的重点,比如下面这个链接:https://blog.csdn.net/Wslsdx/article/details/110728050

  基本上,在空域他的形状就是一些有间隔的白色过度条,在频域,则基本为两处白色亮点,如下图所示:

     

      卷积核空域图形化               对应的频域图

  通常,CV的getGaborKernel函数都要配合Filter2D函数进行卷积得到想要的结果。

  网络上一个有意思的视觉效果方面的算法在https://zhuanlan.zhihu.com/p/584907623有提到,可以用这个滤波器来做一些特效。

static std::vector<cv::Mat> build_filters()
{
std::vector<cv::Mat> filters;
const int ksize = 31;
const double sigma = 4.0;
const double lambd = 10.0;
const double gamma = 0.5;
const double psi = 0;
// 此处创建16个滤波器, 只有 getGaborkernel 的第三个参数 theta 不同
for (int i = 0; i < 16; i++)
{
double theta = CV_PI * i / 16;
cv::Mat kernel = cv::getGaborKernel(cv::Size(ksize, ksize), sigma, theta, lambd, gamma, psi, CV_32F);
kernel /= 1.5 * cv::sum(kernel)[0];
filters.emplace_back(kernel);
}
return filters;
}
cv::Mat process(const cv::Mat& src, std::vector<cv::Mat>& filters)
{
cv::Mat accum = cv::Mat::zeros(src.size(), src.type());
for (cv::Mat kernel: filters)
{
cv::Mat fimg;
AutoTimer timer("filter2D");
cv::filter2D(src, fimg, CV_8UC3, kernel); // 这里是耗时的瓶颈
AutoTimer timer("getmax");
accum = cv::max(accum, fimg);
}
return accum;
}
int main()
{
cv::Mat src = cv::imread(image_path);
std::vector<cv::Mat> filters = build_filters();
cv::Mat res = process(src, filters);
}

   、

  这里用了16个滤波器组合求最大值,得到了一种特征线条凸出的效果。

  当然,OpenCv的这个滤波器在一些特征识别方面也有着很大的作用,比如斑马线识别等等。

  但是,测试发现这个滤波器对参数的配置极其敏感,同一个参数,一般两个值如果只相差一点点,一般出来的效果不会有太大的区别,但是这个函数,确可能会出现极大的差异。比如波长这个参数,当为0.4和0.5的结果大相径庭。       

                波长为0.4时的结果                                                    波长为0.5时的结果

  仔细的分析这个问题,我们会发现,这个还是由于当参数改变时,这个滤波器的权重会出现波动,一般这些卷积核都需要归一化或做相关处理,当波长为0.5时,我们会发现归一化时,所有滤波器的和可能为负数或者很小的数,而为0.4时则较为正常。因此,出现了参数改变一点点,结果改变一大串的问题。

  再稍微撤远一点,当我自己实现这个函数时,我们会发现他的主要耗时还是Filter2D函数,关于这个函数,OpenCV内部是做了优化的,他会根据硬件的支持情况使用opencl/ipp等加速资源实现,速度是相当的快,而且也会对核的大小做判断,很小的核不会使用FFT。  我这里直接使用FFT做的实现,虽然我在进行FFT卷积时做了很多优化,比如拆解为多个256*256的FFT, 比如充分利用虚部的数据等等,结果还是干不过Opencv的速度。

  二、LogGabor滤波器

  拿OpenCv的Gabor滤波器和Halcon的gen_gabor相比,发现他们根本不是一回事,gen_gabor直接生成了频域的数据,而不是生成了卷积核。关于这个算子,我们发现halcon里的描述也不是特别的清晰,这有点不太像他的风格。

  百度搜索gen_gabor我们能发现的99%的资料都是halcon帮助文档的英文原版或者是相关翻译,基本没有对其进行原理进行描述。可能也是因为这个算子不是很常用的原因吧。

  在搜索Gabor滤波器时,也看到了一些文章讲LogGabor滤波器,其中有一篇文章有提到 Log-Gabor函数并不能在空间域中得到表达式,滤波器的构造须在频域中进行,这个和gen_gabor的描述非常相似。后面我们对其参数进行了一些分析,基本可以确定halcon的gabor应该是类似于LogGabor滤波器之类的。

  通过搜索LogGabor,我们得到了一下几个比较有用的参考链接和代码:

   Python OpenCV实现Log Gabor滤波器(由LGHD描述符扩展) 以及 Github中一篇 PhaseCongruency/gaborconvolve.m的matlab代码

  还有一个非常有用的图片:

               

  通过阅读这几篇文章及其配套的代码,我们发现这个频域的滤波器可由Log-Radial Gaussian和Angular Gaussian组合而成,在Python那篇文章中,则有这更为明确的公式:

  原文描述如下:

      一个二维的L-Gaborj波器可以分解为径向滤波器和角度滤波器两部分,对应极坐标公式为:

          

      完整的Log-Gabor滤波器由这两部分相乘得到:

            

  这个公式也和上面的图片能完全对应。

  在代码实现上,我发现无损是Python的代码还是matlab的代码其实都是一个版本的,他们在计算有关的过程中都有一个lowpass的过程,我不清楚那个是目的是啥,也不知道哪里的参数来源依据是什么,但是我感觉他们不应该是我所需要的,我需要的就是上面两个公式,结合那些参考代码,我们对第一个公式(径向滤波器)的M代码实现如下:

WaveLength = 10;
SigmaR = 0.4;
cols = 500, rows=500;
[x,y] = meshgrid( [-cols/2:(cols/2-1)]/cols,[-rows/2:(rows/2-1)]/rows);
radius = sqrt(x.^2 + y.^2);
Frequency = 1.0 / WaveLength; % 频率等于波长的导数
logGabor = exp((-(log(radius / Frequency)).^2) / (2 * SigmaR * SigmaR)); % log gabor函数的传递函数表达式
imshow(logGabor,[])

  对第二个公式的实现代码如下:

Angle = 45 / 180 *3.1415926;
SigmaA = 0.4;
cols = 500, rows=500;
[x,y] = meshgrid( [-cols/2:(cols/2-1)]/cols,[-rows/2:(rows/2-1)]/rows);
theta = atan2(-y,x);
sintheta = sin(theta);
costheta = cos(theta);
ds = sintheta * cos(Angle) - costheta * sin(Angle);
dc = costheta * cos(Angle) + sintheta * sin(Angle);
dtheta = atan2(abs(ds),abs(dc));
spread = exp((-dtheta.^2) / (2 * SigmaA * SigmaA));
imshow(spread,[])

  当将两者组合起来后,即产生如下的代码:

WaveLength = 10;
SigmaR = 0.4;
Angle = 45 / 180 *3.1415926;
SigmaA = 0.4;
cols = 500, rows=500;
[x,y] = meshgrid( [-cols/2:(cols/2-1)]/cols,[-rows/2:(rows/2-1)]/rows);
radius = sqrt(x.^2 + y.^2);
Frequency = 1.0 / WaveLength; % 频率等于波长的导数
logGabor = exp((-(log(radius / Frequency)).^2) / (2 * SigmaR * SigmaR)); % log gabor函数的传递函数表达式
theta = atan2(-y,x);
sintheta = sin(theta);
costheta = cos(theta);
ds = sintheta * cos(Angle) - costheta * sin(Angle);
dc = costheta * cos(Angle) + sintheta * sin(Angle);
dtheta = atan2(abs(ds),abs(dc));
spread = exp((-dtheta.^2) / (2 * SigmaA * SigmaA));
imshow(logGabor .* spread,[])

  三段代码产生的图像依次如下所示:

  

                                        WaveLength = 10,SigmaR = 0.4,Angle = 45 / 180 *3.1415926, SigmaA = 0.4;

  通过改变参数可以获得不同的效果,比如,WaveLength = 5,SigmaR = 0.05,Angle = 30 / 180 *3.1415926, SigmaA = 0.3时的效果如下:

    

  注意到,相比于原始的代码,我们在计算dtheta时,稍微做了修改,这是因为,频域的数据一般是要求堆成的,而原始的角向滤波器是非对称的,因此,我们改成了atan2(abs(ds),abs(dc));

  这个生成的过程里有很多浮点的计算,而且有几个复杂度比较高的函数,因此,计算还是有所耗时的。

  我们来和halcon的gen_gabor的参数做下比较:

        gen_gabor( : ImageFilter : Angle, Frequency, Bandwidth, Orientation, Norm, Mode, Width, Height : )

  后面Norm, Mode, Width, Height 这四个参数不用管它,我们主要看看前面四个参数。

  注意到我们刚才的代码里也提供了四个可选的参数,即WaveLength,SigmaR,Angle, SigmaA,那他们之间有么有什么对应的关系呢。

  通过多次比较和测试,我们可以定性的确定如下联系:

  1、gen_gabor里的Orientation和我的LogGabor里的Angle基本是一个意思,这个可以从Orientation的范围可以看到,就是个角度范围:

     Orientation (input_control) real → (real)
        Angle of the principal orientation,Suggested values: 0.0, 0.2, 0.4, 0.6, 0.8, 1.0, 1.2, 1.4, 1.6, 1.8, 2.0, 2.2, 2.4, 2.6, 2.8, 3.0, 3.14

    2、gen_gabor的Bandwidth和LogGabor的SigmaR的趋势基本是一致的。

3、gen_gabor的Frequency和LogGabor的WaveLength的趋势基本是相反的,但是WaveLength本身就是Frenquency的倒数,都是会随着Frequency的变小,频域的有效部分想中心收缩。

4、gen_gabor的Angle和LogGabor的SigmaA的趋势基本是相反的。

  也就是说这4个参数基本上都存在一一对应的关系,只是说我们无法确认他们之间的绝对值之间的联系,毕竟halcon里也没有提供具体的计算式,只要稍微某个地方有些取值不同,就会造成不同的结果。

  由于loggabor提供的已经是频域的数据了,因此,后续的计算就比较简单了,因为频域的乘法就相当于于时域的卷积,因此,直接把某个图像的频域数据乘以这个LogGabor数据就可以了。

但是,这就要求LogGabor的数据维度必须和图像是一样大小的,其实这个有个隐藏的问题,即边缘问题,因为卷积对于边缘一般来说是需要扩展的,否则会遇到一些小小意料之外的问题。

  做了一个简单的比较,当gen_gabor和LogGabor滤波器的可视化图基本类似时,大部分情况两者之间的效果似乎方向是一致的。

    

            halcon的gen_gabor可视化结果                                      对应的滤波器输出

    

     LogGabor参数                            LogGabor可视化结果                            对应的滤波器结果

  上述结果的halcon代码如下所示:

read_image (Image, 'fabrik')
get_image_size (Image, Width, Height)
gen_gabor(Filter,10,0.1,50,1.57,'n','dc_center',Width, Height)
fft_generic(Image,ImageFFT,'to_freq',-1,'none','dc_center','complex')
convol_gabor(ImageFFT,Filter,Gabor,Hilbert)
fft_generic(Gabor,GaborInv,'from_freq',1,'none','dc_center','byte')

  可以看出,两者的结果存在一定的相似性,从某个侧面说明我们的猜测具有一定的科学性。

  三、速度优化

  从上面的过程可以看到我们的LogGabor滤波器的生成有着较为复杂的计算公式,而且有多个函数调用,这些函数其实都是有着较为复杂的内部计算的,要进行优化,可以从多方面出发,第一个是用C语言处理吧,把一些公共的计算放到循环外部,把能优化掉的除法尽量改为乘法,还可以把那个exp的计算合并为一个,因为我们知道exp(a) * exp(b) = exp(a+b),这样就可以减少一次exp计算了。

  当然,我们还可以进行指令集优化,我们可以自定义_mm_atan2_ps, _mm_sincos_ps, _mm_exp_ps等等指令集函数(网络上可以找到的),他们可以接受成吨的输出。很爽,至少速度比C版本的提高3到4倍。

  我们在计算频域相乘时,也可以适当的考虑扩大图像,让图像的尺寸变为那些更有利于做FFT变换的数据,比如4、5、8的倍数等等,这样,可以有效地提高FFT的运算速度,并且对结果只会造成轻微的影响。

  关于这个算法目前就研究这么多吧,希望能造福有需要的人,也能造福自己。

  此更新算法位于我的SSE Demo的如下目录:   Detection(检测相关)---》Gabor Filter(Gabor滤波)。

  SSE Demo下载地址: https://files.cnblogs.com/files/Imageshop/SSE_Optimization_Demo.rar

  如果想时刻关注本人的最新文章,也可关注公众号或者添加本人微信:  laviewpbt

翻译

搜索

复制

【短道速滑十一】标准的Gabor滤波器及Log_Gabor滤波器的实现、解析、速度优化及其和Halcon中gen_gabor的比较。的更多相关文章

  1. FIR滤波器和IIR滤波器的区别

    数字滤波器广泛应用于硬件电路设计,在离散系统中尤为常见,一般可以分为FIR滤波器和IIR滤波器,那么他们有什么区别和联系呢. FIR滤波器 定义: FIR滤波器是有限长单位冲激响应滤波器,又称为非递归 ...

  2. 【短道速滑一】OpenCV中cvResize函数使用双线性插值缩小图像到长宽大小一半时速度飞快(比最近邻还快)之异象解析和自我实现。

    今天,一个朋友想使用我的SSE优化Demo里的双线性插值算法,他已经在项目里使用了OpenCV,因此,我就建议他直接使用OpenCV,朋友的程序非常注意效率和实时性(因为是处理视频),因此希望我能测试 ...

  3. 【短道速滑九】仿halcon中gauss_filter小半径高斯模糊优化的实现

    通常,我们谈的高斯模糊,都知道其是可以行列分离的算法,现在也有着各种优化算法实现,而且其速度基本是和参数大小无关的.但是,在我们实际的应用中,我们可能会发现,有至少50%以上的场景中,我们并不需要大半 ...

  4. IIR滤波器和FIR滤波器的区别与联系zz

      -------------------------------------------------------------------------------------------------- ...

  5. FIR滤波器与IIR滤波器

    FIR(Finite Impulse Response)滤波器 有限长单位冲激响应滤波器,又称为非递归型滤波器 特点: FIR滤波器的最主要的特点是没有反馈回路,稳定性强,故不存在不稳定的问题: FI ...

  6. 标准格式包含: 私有属性 无参构造 有参构造 setter 和getter 需求中的方法 需求一: 员工类Employee 属性:姓名name,工号id,工资salary 行为:显示所有成员信息的方法show() 需求二: 动物类Animal 属性:姓名name,年龄age 行为:吃饭

      // 员工类 public class Employee { private String name; private int id; private double salary; public ...

  7. 设计模式(三十一)----综合应用-自定义Spring框架-自定义Spring IOC-定义解析器、IOC容器相关类

    3 定义解析器相关类 3.1 BeanDefinitionReader接口 BeanDefinitionReader是用来解析配置文件并在注册表中注册bean的信息.定义了两个规范: 获取注册表的功能 ...

  8. iOS 底层框架的浅析

    1.简介 IOS是由苹果公司为iPhone.iPod touch和iPad等设备开发的操作系统. 2.知识点 iPhone OS(现在叫iOS)是iPhone, iPod touch 和 iPad 设 ...

  9. IOS计划 分析

    1.基本介绍 IOS苹果公司iPhone.iPod touch和iPad操作系统和其他设备的发展. 2.知识点 1.IOS系统 iPhone OS(现在所谓的iOS)这是iPhone, iPod to ...

  10. 超越halcon速度的二值图像的腐蚀和膨胀,实现目前最快的半径相关类算法(附核心源码)。

    我在两年前的博客里曾经写过 SSE图像算法优化系列七:基于SSE实现的极速的矩形核腐蚀和膨胀(最大值和最小值)算法  一文,通过SSE的优化把矩形核心的腐蚀和膨胀做到了不仅和半径无关,而且速度也相当的 ...

随机推荐

  1. 1.6 编写双管道ShellCode后门

    本文将介绍如何将CMD绑定到双向管道上,这是一种常用的黑客反弹技巧,可以让用户在命令行界面下与其他程序进行交互,我们将从创建管道.启动进程.传输数据等方面对这个功能进行详细讲解.此外,本文还将通过使用 ...

  2. 【Spring boot】 @Value注解

    一.不通过配置文件的注入属性 1.1 注入普通字符串 直接附在属性名上,在 Bean 初始化时,会赋初始值 @Value("normal") private String norm ...

  3. 【环境搭建】多版本的jdk共存

    问题来源 burpsuite 2021需要使用Java 9及以上版本,而其他工具需要Java 8,因此需要两个版本共存,并且做到除了burpsuite以外的工具默认使用Java 8打开. 需要的软件 ...

  4. GoFrame v2.5 版本发布,企业级 Golang 开发框架

    大家好啊,GoFrame 框架今天发布了 v2.5.0 正式版本啦! 本次版本主要是对已有功能组件以及开发工具上的改进工作.其中,开发工具新增了 gf gen ctrl 命令,以规范化定义.开发 AP ...

  5. CSS: 绝对定位fixed

    属性介绍 元素会被移出正常文档流,并不为元素预留空间,而是通过指定元素相对于屏幕视口(viewport)的位置来指定元素位置.元素的位置在屏幕滚动时不会改变.打印时,元素会出现在的每页的固定位置.fi ...

  6. C#/.NET/.NET Core优秀项目和框架每周精选(坑已挖,欢迎大家踊跃提交PR或者Issues中留言)

    前言 注意:排名不分先后,都是十分优秀的开源项目和框架,每周定期更新分享(欢迎关注公众号:追逐时光者,第一时间获取每周精选分享资讯). 每周精选优秀的C#/.NET/.NET Core项目和框架,帮助 ...

  7. 从原理聊JVM(四):JVM中的方法调用原理

    1 引言 多态是Java语言极为重要的一个特性,可以说是Java语言动态性的根本,那么线程执行一个方法时到底在内存中经历了什么,JVM又是如何确定方法执行版本的呢? 2 栈帧 JVM中由栈帧存储方法的 ...

  8. Android Studio Giraffe安装与gradle配置

    本机环境:win10专业版,64位,16G内存. 原先用的AS2.2,是很早之前在看<第一行代码Android(第2版)>的时候,按书里的链接下载安装的,也不用怎么配置.(PS:第一行代码 ...

  9. Docker从入门到部署项目

    Docker概念 Docker是一个开源的应用容器引擎,它是基于Go语言并遵从Apache2.0协议开源.Docker可以让开发者打包他们的应用以及依赖包到一个轻量级.可移植的容器中,然后发布到任何流 ...

  10. aspnetcore 注册中心 consul

    consul启动 . http://192.168.1.6:8500/ #以server方式启动,UI可以访问,boot引导自己选为leader,网段内PC可访问 consul agent -serv ...