一种局部二值化算法：Sauvola算法

之前接触过全局二值化（OTSU算法），还有OPENCV提供的自适应二值化，最近又了解到一种新的局部二值化算法，Sauvola算法。

转载自：http://www.dididongdong.com/archives/4048

值得注意的是，计算r×r邻域内像素值的时候，一种优化的策略是，使用OPENCV提供的积分图，计算整张图像的积分图，那么计算r×r区域内的均值可以在常数时间内实现。

CV_EXPORTS_W void integral( InputArray src, OutputArray sum, int sdepth = - );

我们常见的图像二值化算法大致可分为全局阈值方法与局部阈值方法这两种类型。其中OTSU算法是全局阈值的代表，而Sauvola算法则是局部阈值方法的标杆。Sauvola算法的输入是灰度图像，它以当前像素点为中心，根据当前像素点邻域内的灰度均值与标准方差来动态计算该像素点的阈值。

假定当前像素点的坐标为(x,y)，以该点为中心的领域为r*r，g(x,y)表示(x,y)处的灰度值，Sauvola算法的步骤为：

来自参考《基于光照不均匀图像的自适应二值化方法研究》郭佳

引用

在二值化的操作中，用的比较多的就是全局阈值话OTSU（大津法）和局部阈值NiBlack，Niblack方法是一种简单有效的动态阈值分割方法，修改得到最佳参数之后的效果比大津法要好，因为大津法是根据整个图像来确定一个阈值，而Niblack则是在不同的R*R区域会有不同的阈值。

Niblack的基本思想是：对于图像的每一个像素点，在rxr领域空问里，计算该像素点领域方位内其他像素点的均值和方差。然后利用公式（1）进行二值化。

其中，T（x,y）是阈值，k是预先设定的修正值,图像为f(x,y)，均值为m(x,y)，方差为s(x,y)。

使用Niblack法的优点在于：

对每一个像素点都独立的跟据此像素点的邻域的情况来计算门限，对于和邻域均值m(x，y)相近的像素点判断为背景而反之判断为前景；而具体相近到什么程度由标准差s(X’y)和修正系数k来决定，这保证了这种的方法的灵活性。

使用Niblack法的不足在于：

由于要利用域r×r模板遍历图像，导致边界区域（r-1）/2的像素范围内无法求取阈值；同时当进行图像遍历时，如果域r×r范围内都是背景，经NIBLACK计算后必有一部分被确定为目标，产生伪噪声。

总之，用Niblack方法进行图像分割时，选择的处理模板窗口R*R大小的选择很关键，选择的空间太小，则噪声抑制的效果不理想，目标主体不够突出，选择的空间太大，则目标的细节会被去除而丢失信息。

参考

1.第一次做MathOCR遇到的参考文献：
《图片中印刷体数学公式的自动识别》陈颂光
2.中文的的链接来自，追溯不到原文：

https://livezingy.com/derivations-of-sauvola-formula/
3.英文文献：值得参考的标准
Efficient implementation of local adaptive thresholding techniques using integral images
PDF链接为：https://pdfs.semanticscholar.org/8130/a9499715d22468492c3786c34ba1ba0b4ed3.pdf
4.Matlab代码参考
http://freesourcecode.net/matlabprojects/59687/sauvola-local-image-thresholding-in-matlab#.Wzsk2oq-vcs

5,https://www.cnblogs.com/guopengfei/p/4766526.html

//求区域内均值 integral即为积分图

float fastMean(cv::Mat& integral, int x, int y, int window)

{

    int min_y = std::max(, y - window / );

    int max_y = std::min(integral.rows - , y + window / );

    int min_x = std::max(, x - window / );

    int max_x = std::min(integral.cols - , x + window / );

    int topright = integral.at<int>(max_y, max_x);

    int botleft = integral.at<int>(min_y, min_x);

    int topleft = integral.at<int>(max_y, min_x);

    int botright = integral.at<int>(min_y, max_x);

    float res = (float)((topright + botleft - topleft - botright) / (float)((max_y - min_y) *(max_x - min_x)));

    return res;

}

cv::Mat& Sauvola(cv::Mat& inpImg, cv::Mat& resImg,  int window, float k)

{

    cv::Mat integral;

    int nYOffSet = ;

    int nXOffSet = ;

    cv::integral(inpImg, integral);  //计算积分图像

    for (int y = ; y < inpImg.rows; y += nYOffSet)

    {

        for (int x = ; x < inpImg.cols; x += nXOffSet)

        {

            float fmean = fastMean(integral, x, y, window);float fthreshold = (float)(fmean*(1.0 - k));  

            int nNextY = y + nYOffSet;

            int nNextX = x + nXOffSet;

            int nCurY = y;

            while (nCurY < nNextY && nCurY < inpImg.rows)

            {

                int nCurX = x;

                while (nCurX < nNextX && nCurX < inpImg.cols)

                {

                    uchar val = inpImg.at<uchar>(nCurY, nCurX) < fthreshold;

                    resImg.at<uchar>(nCurY, nCurX) = (val ==  ?  : );

                    nCurX++;

                }

                nCurY++;

            }

        }

    }

    return resImg;

}

//************************************

// 函数名称: sauvola

// 函数说明: 局部均值二值化

// 参    数:

//           const unsigned char * grayImage        [in]        输入图像数据

//           const unsigned char * biImage          [out]       输出图像数据     

//           const int w                            [in]        输入输出图像数据宽

//           const int h                            [in]        输入输出图像数据高

//           const int k                            [in]        threshold = mean*(1 + k*((std / 128) - 1))

//           const int windowSize                   [in]        处理区域宽高

// 返 回 值: void

//************************************

void sauvola(const unsigned char * grayImage, const unsigned char * biImage,

    const int w, const int h, const int k, const int windowSize){

    int whalf = windowSize >> ;

    int i, j;

    int IMAGE_WIDTH = w;

    int IMAGE_HEIGHT = h;

    // create the integral image

    unsigned long * integralImg = (unsigned long*)malloc(IMAGE_WIDTH*IMAGE_HEIGHT*sizeof(unsigned long*));

    unsigned long * integralImgSqrt = (unsigned long*)malloc(IMAGE_WIDTH*IMAGE_HEIGHT*sizeof(unsigned long*));

    int sum = ;

    int sqrtsum = ;

    int index;

    //收集数据 integralImg像素和积分图 integralImgSqrt像素平方和积分图

    for (i = ; i < IMAGE_HEIGHT; i++){

        // reset this column sum

        sum = ;

        sqrtsum = ;

        for (j = ; j < IMAGE_WIDTH; j++)

        {

            index = i*IMAGE_WIDTH + j;

            sum += grayImage[index];

            sqrtsum += grayImage[index] * grayImage[index];

            if (i == ){

                integralImg[index] = sum;

                integralImgSqrt[index] = sqrtsum;

            }

            else{

                integralImgSqrt[index] = integralImgSqrt[(i - )*IMAGE_WIDTH + j] + sqrtsum;

                integralImg[index] = integralImg[(i - )*IMAGE_WIDTH + j] + sum;

            }

        }

    }

    //Calculate the mean and standard deviation using the integral image

    int xmin, ymin, xmax, ymax;

    double mean, std, threshold;

    double diagsum, idiagsum, diff, sqdiagsum, sqidiagsum, sqdiff, area;

    for (i = ; i < IMAGE_WIDTH; i++){

        for (j = ; j < IMAGE_HEIGHT; j++){

            xmin = max(, i - whalf);

            ymin = max(, j - whalf);

            xmax = min(IMAGE_WIDTH - , i + whalf);

            ymax = min(IMAGE_HEIGHT - , j + whalf);

            area = (xmax - xmin + ) * (ymax - ymin + );

            if (area <= ){

                biImage[i * IMAGE_WIDTH + j] = ;

                continue;

            }

            if (xmin ==  && ymin == ){

                diff = integralImg[ymax * IMAGE_WIDTH + xmax];

                sqdiff = integralImgSqrt[ymax * IMAGE_WIDTH + xmax];

            }

            else if (xmin >  && ymin == ){

                diff = integralImg[ymax * IMAGE_WIDTH + xmax] - integralImg[ymax * IMAGE_WIDTH + xmin - ];

                sqdiff = integralImgSqrt[ymax * IMAGE_WIDTH + xmax] - integralImgSqrt[ymax * IMAGE_WIDTH + xmin - ];

            }

            else if (xmin ==  && ymin > ){

                diff = integralImg[ymax * IMAGE_WIDTH + xmax] - integralImg[(ymin - ) * IMAGE_WIDTH + xmax];

                sqdiff = integralImgSqrt[ymax * IMAGE_WIDTH + xmax] - integralImgSqrt[(ymin - ) * IMAGE_WIDTH + xmax];;

            }

            else{

                diagsum = integralImg[ymax * IMAGE_WIDTH + xmax] + integralImg[(ymin - ) * IMAGE_WIDTH + xmin - ];

                idiagsum = integralImg[(ymin - ) * IMAGE_WIDTH + xmax] + integralImg[ymax * IMAGE_WIDTH + xmin - ];

                diff = diagsum - idiagsum;

                sqdiagsum = integralImgSqrt[ymax * IMAGE_WIDTH + xmax] + integralImgSqrt[(ymin - ) * IMAGE_WIDTH + xmin - ];

                sqidiagsum = integralImgSqrt[(ymin - ) * IMAGE_WIDTH + xmax] + integralImgSqrt[ymax * IMAGE_WIDTH + xmin - ];

                sqdiff = sqdiagsum - sqidiagsum;

            }

            mean = diff / area;

            std = sqrt((sqdiff - diff*diff / area) / (area - ));

            threshold = mean*( + k*((std / ) - ));

            if (grayImage[j*IMAGE_WIDTH + i] < threshold)

                biImage[j*IMAGE_WIDTH + i] = ;

            else

                biImage[j*IMAGE_WIDTH + i] = ;

        }

    }

    free(integralImg);

    free(integralImgSqrt);

sauvola是一种考虑局部均值亮度的图像二值化方法, 以局部均值为基准在根据标准差做些微调.算法实现上一般用积分图方法

来实现.这个方法能很好的解决全局阈值方法的短板—关照不均图像二值化不好的问题.

代码要注意下面几点:

1 计算区域像素和,几乎使用积分图技术是必然的选择.

2 标准差的表示方法: std = sqrt((sqdiff - diff*diff / area) / (area - )) 终于感到高等代数没有白学,

3 判定方程 threshold = mean*(1 + k*((std / 128) - 1)). 首先均值是基础, 如果标准差大写,阈值就会大些,标准差小些,阈值就会小些.

这个方法对一些不是光照不均的图片有时候效果不好,现在还在找较好的方法,初步打算先用全局均值做二值化,如何效果不好再用局部均值的方法.

以上转载自：

https://www.cnblogs.com/guopengfei/p/4766526.html

一种局部二值化算法：Sauvola算法的更多相关文章

【计算机视觉】纹理特征之LBP局部二值化模式
转自http://blog.csdn.NET/ty101/article/details/8905394 本文的PDF版本,以及涉及到的所有文献和代码可以到下列地址下载: 1.PDF版本以及文献:ht ...
OpenCV_基于局部自适应阈值的图像二值化
在图像处理应用中二值化操作是一个很常用的处理方式,例如零器件图片的处理.文本图片和验证码图片中字符的提取.车牌识别中的字符分割,以及视频图像中的运动目标检测中的前景分割,等等. 较为常用的图像二值化方 ...
【转】Emgu CV on C# （五） —— Emgu CV on 局部自适应阈值二值化
局部自适应阈值二值化相对全局阈值二值化,自然就有局部自适应阈值二值化,本文利用Emgu CV实现局部自适应阈值二值化算法,并通过调节block大小,实现图像的边缘检测. 一.理论概述(转载自< ...
[转载+原创]Emgu CV on C# （五） —— Emgu CV on 局部自适应阈值二值化
局部自适应阈值二值化相对全局阈值二值化,自然就有局部自适应阈值二值化,本文利用Emgu CV实现局部自适应阈值二值化算法,并通过调节block大小,实现图像的边缘检测. 一.理论概述(转载自< ...
[转载+原创]Emgu CV on C# （四） —— Emgu CV on 全局固定阈值二值化
重点介绍了全局二值化原理及数学实现,并利用emgucv方法编程实现. 一.理论概述(转载,如果懂图像处理,可以略过,仅用作科普,或者写文章凑字数) 1.概述图像二值化是图像处理中的一项基本技术,也 ...
openCV_java 图像二值化
较为常用的图像二值化方法有:1)全局固定阈值:2)局部自适应阈值:3)OTSU等. 局部自适应阈值则是根据像素的邻域块的像素值分布来确定该像素位置上的二值化阈值.这样做的好处在于每个像素位置处的二值化 ...
sauvola二值化算法研究
sauvola二值化算法研究 sauvola是一种考虑局部均值亮度的图像二值化方法, 以局部均值为基准在根据标准差做些微调.算法实现上一般用积分图方法来实现.这个方法能很好的解决全局阈值方法的短 ...
Wellner 自适应阈值二值化算法
参考文档: Adaptive Thresholding for the DigitalDesk.pdf Adaptive Thresholding Using the Integral I ...
《opencv学习》之 OTSU算法实现二值化
主要讲解OTSU算法实现图像二值化: 1.统计灰度级图像中每个像素值的个数. 2.计算第一步个数占整个图像的比例. 3.计算每个阈值[0-255]条件下,背景和前景所包含像素值总个数和总概率(就 ...

随机推荐

python子进程模块subprocess详解
subprocess--子进程管理器一.subprocess 模块简介subprocess最早是在2.4版本中引入的.subprocess模块用来生成子进程,并可以通过管道连接它们的输入/输出/错误, ...
django笔记三之admin的管理
django笔记三之admin的管理设置自动admin应用 vim todos/settings.py INSTALLED_APPS = ( 'django.contrib.admin', 新版本已 ...
Java 缓存池（使用Map实现）
之前只是听说过缓存池,也没有具体的接触到,今天做项目忽然想到了用缓存池,就花了一上午的时间研究了下缓存池的原理,并实现了基本的缓存池功能. /** * 缓存池 * @author xiaoquan * ...
Java注解Annotation与自定义注解详解
Java注解简介开发中经常使用到注解,在项目中也偶尔会见到过自定义注解,今天就来探讨一下这个注解是什么鬼,以及注解的应用场景和如何自定义注解. 下面列举开发中常见的注解 @Override:用于标识 ...
spring security基本知识(一)
spring security基本知识(一) Spring Security是为基于Spring的应用程序提供声明式安全保护的安全性框架.Spring Security提供了完整的安全性解决方案,它 ...
微信小程序中的自定义组件(components)
其实小程序开发很像vue和react的结合,数据绑定和setData 重新渲染页面的数据,最近发现连写组件都是很像,也是醉了,自我认为哈, 因为小程序可以将页面内的功能模块抽象成自定义组件,以便在 ...
shell练习--PAT题目1007：关于素数对（失败案例）
让我们定义dn为:dn=pn+1−pn,其中pi是第i个素数.显然有d1=1,且对于n>1有dn是偶数.“素数对猜想”认为“存在无穷多对相邻且差为2的素 ...
【canvas学习笔记六】状态保存和变换
save()和restore() save() 保存当前状态,将当前canvas的状态存入栈中. restore() 恢复之前save的一个状态,将之前的状态从栈中弹出. 保存的当前状态包含以下信息: ...
Python3学习笔记(五)：列表和元组
一.列表列表是可变的--可以改变列表的内容 list函数可以把各种类型的序列拆分列表 >>> list('Hello') ['H', 'e', 'l', 'l', 'o'] 二.列 ...
[BZOJ5463][APIO2018]铁人两项：Tarjan+圆方树
分析根据题目中的要求,从\(s\)出发前往\(f\)一定可以,并且只可能经过这两个结点所在的点双连通分量和它们之间的点双连通分量,因此切换点\(c\)只能从这些点中选取. 建出圆方树后,因为圆方树上 ...

一种局部二值化算法：Sauvola算法

引用

参考

一种局部二值化算法：Sauvola算法的更多相关文章

随机推荐

热门专题