一种局部二值化算法:Sauvola算法
之前接触过全局二值化(OTSU算法),还有OPENCV提供的自适应二值化,最近又了解到一种新的局部二值化算法,Sauvola算法。
转载自:http://www.dididongdong.com/archives/4048
值得注意的是,计算r×r邻域内像素值的时候,一种优化的策略是,使用OPENCV提供的积分图,计算整张图像的积分图,那么计算r×r区域内的均值可以在常数时间内实现。
CV_EXPORTS_W void integral( InputArray src, OutputArray sum, int sdepth = - );
我们常见的图像二值化算法大致可分为全局阈值方法与局部阈值方法这两种类型。其中OTSU算法是全局阈值的代表,而Sauvola算法则是局部阈值方法的标杆。Sauvola算法的输入是灰度图像,它以当前像素点为中心,根据当前像素点邻域内的灰度均值与标准方差来动态计算该像素点的阈值。
假定当前像素点的坐标为(x,y),以该点为中心的领域为r*r,g(x,y)表示(x,y)处的灰度值,Sauvola算法的步骤为:

来自参考《基于光照不均匀图像的自适应二值化方法研究》郭佳
引用
在二值化的操作中,用的比较多的就是全局阈值话OTSU(大津法)和局部阈值NiBlack,Niblack方法是一种简单有效的动态阈值分割方法,修改得到最佳参数之后的效果比大津法要好,因为大津法是根据整个图像来确定一个阈值,而Niblack则是在不同的R*R区域会有不同的阈值。
Niblack的基本思想是:对于图像的每一个像素点,在rxr领域空问里,计算该像素点领域方位内其他像素点的均值和方差。然后利用公式(1)进行二值化。
其中,T(x,y)是阈值,k是预先设定的修正值,图像为f(x,y),均值为m(x,y),方差为s(x,y)。
使用Niblack法的优点在于:
对每一个像素点都独立的跟据此像素点的邻域的情况来计算门限,对于和邻域均值m(x,y)相近的像素点判断为背景而反之判断为前景;而具体相近到什么程度由标准差s(X’y)和修正系数k来决定,这保证了这种的方法的灵活性。
使用Niblack法的不足在于:
由于要利用域r×r模板遍历图像,导致边界区域(r-1)/2的像素范围内无法求取阈值;同时当进行图像遍历时,如果域r×r范围内都是背景,经NIBLACK计算后必有一部分被确定为目标,产生伪噪声。
总之,用Niblack方法进行图像分割时,选择的处理模板窗口R*R大小的选择很关键,选择的空间太小,则噪声抑制的效果不理想,目标主体不够突出,选择的空间太大,则目标的细节会被去除而丢失信息。
参考
1.第一次做MathOCR遇到的参考文献:
《图片中印刷体数学公式的自动识别》陈颂光
2.中文的的链接来自,追溯不到原文:
https://livezingy.com/derivations-of-sauvola-formula/
3.英文文献:值得参考的标准
Efficient implementation of local adaptive thresholding techniques using integral images
PDF链接为:https://pdfs.semanticscholar.org/8130/a9499715d22468492c3786c34ba1ba0b4ed3.pdf
4.Matlab代码参考
http://freesourcecode.net/matlabprojects/59687/sauvola-local-image-thresholding-in-matlab#.Wzsk2oq-vcs
5,https://www.cnblogs.com/guopengfei/p/4766526.html
//求区域内均值 integral即为积分图
float fastMean(cv::Mat& integral, int x, int y, int window)
{ int min_y = std::max(, y - window / );
int max_y = std::min(integral.rows - , y + window / );
int min_x = std::max(, x - window / );
int max_x = std::min(integral.cols - , x + window / ); int topright = integral.at<int>(max_y, max_x);
int botleft = integral.at<int>(min_y, min_x);
int topleft = integral.at<int>(max_y, min_x);
int botright = integral.at<int>(min_y, max_x); float res = (float)((topright + botleft - topleft - botright) / (float)((max_y - min_y) *(max_x - min_x))); return res;
} cv::Mat& Sauvola(cv::Mat& inpImg, cv::Mat& resImg, int window, float k)
{
cv::Mat integral;
int nYOffSet = ;
int nXOffSet = ;
cv::integral(inpImg, integral); //计算积分图像
for (int y = ; y < inpImg.rows; y += nYOffSet)
{
for (int x = ; x < inpImg.cols; x += nXOffSet)
{ float fmean = fastMean(integral, x, y, window);float fthreshold = (float)(fmean*(1.0 - k)); int nNextY = y + nYOffSet;
int nNextX = x + nXOffSet;
int nCurY = y;
while (nCurY < nNextY && nCurY < inpImg.rows)
{
int nCurX = x;
while (nCurX < nNextX && nCurX < inpImg.cols)
{
uchar val = inpImg.at<uchar>(nCurY, nCurX) < fthreshold;
resImg.at<uchar>(nCurY, nCurX) = (val == ? : );
nCurX++;
}
nCurY++;
} }
} return resImg;
}
//************************************
// 函数名称: sauvola
// 函数说明: 局部均值二值化
// 参 数:
// const unsigned char * grayImage [in] 输入图像数据
// const unsigned char * biImage [out] 输出图像数据
// const int w [in] 输入输出图像数据宽
// const int h [in] 输入输出图像数据高
// const int k [in] threshold = mean*(1 + k*((std / 128) - 1))
// const int windowSize [in] 处理区域宽高
// 返 回 值: void
//************************************
void sauvola(const unsigned char * grayImage, const unsigned char * biImage,
const int w, const int h, const int k, const int windowSize){
int whalf = windowSize >> ;
int i, j;
int IMAGE_WIDTH = w;
int IMAGE_HEIGHT = h;
// create the integral image
unsigned long * integralImg = (unsigned long*)malloc(IMAGE_WIDTH*IMAGE_HEIGHT*sizeof(unsigned long*));
unsigned long * integralImgSqrt = (unsigned long*)malloc(IMAGE_WIDTH*IMAGE_HEIGHT*sizeof(unsigned long*));
int sum = ;
int sqrtsum = ;
int index;
//收集数据 integralImg像素和积分图 integralImgSqrt像素平方和积分图
for (i = ; i < IMAGE_HEIGHT; i++){
// reset this column sum
sum = ;
sqrtsum = ;
for (j = ; j < IMAGE_WIDTH; j++)
{
index = i*IMAGE_WIDTH + j;
sum += grayImage[index];
sqrtsum += grayImage[index] * grayImage[index];
if (i == ){
integralImg[index] = sum;
integralImgSqrt[index] = sqrtsum;
}
else{
integralImgSqrt[index] = integralImgSqrt[(i - )*IMAGE_WIDTH + j] + sqrtsum;
integralImg[index] = integralImg[(i - )*IMAGE_WIDTH + j] + sum;
}
}
}
//Calculate the mean and standard deviation using the integral image
int xmin, ymin, xmax, ymax;
double mean, std, threshold;
double diagsum, idiagsum, diff, sqdiagsum, sqidiagsum, sqdiff, area;
for (i = ; i < IMAGE_WIDTH; i++){
for (j = ; j < IMAGE_HEIGHT; j++){
xmin = max(, i - whalf);
ymin = max(, j - whalf);
xmax = min(IMAGE_WIDTH - , i + whalf);
ymax = min(IMAGE_HEIGHT - , j + whalf);
area = (xmax - xmin + ) * (ymax - ymin + );
if (area <= ){
biImage[i * IMAGE_WIDTH + j] = ;
continue;
}
if (xmin == && ymin == ){
diff = integralImg[ymax * IMAGE_WIDTH + xmax];
sqdiff = integralImgSqrt[ymax * IMAGE_WIDTH + xmax];
}
else if (xmin > && ymin == ){
diff = integralImg[ymax * IMAGE_WIDTH + xmax] - integralImg[ymax * IMAGE_WIDTH + xmin - ];
sqdiff = integralImgSqrt[ymax * IMAGE_WIDTH + xmax] - integralImgSqrt[ymax * IMAGE_WIDTH + xmin - ];
}
else if (xmin == && ymin > ){
diff = integralImg[ymax * IMAGE_WIDTH + xmax] - integralImg[(ymin - ) * IMAGE_WIDTH + xmax];
sqdiff = integralImgSqrt[ymax * IMAGE_WIDTH + xmax] - integralImgSqrt[(ymin - ) * IMAGE_WIDTH + xmax];;
}
else{
diagsum = integralImg[ymax * IMAGE_WIDTH + xmax] + integralImg[(ymin - ) * IMAGE_WIDTH + xmin - ];
idiagsum = integralImg[(ymin - ) * IMAGE_WIDTH + xmax] + integralImg[ymax * IMAGE_WIDTH + xmin - ];
diff = diagsum - idiagsum;
sqdiagsum = integralImgSqrt[ymax * IMAGE_WIDTH + xmax] + integralImgSqrt[(ymin - ) * IMAGE_WIDTH + xmin - ];
sqidiagsum = integralImgSqrt[(ymin - ) * IMAGE_WIDTH + xmax] + integralImgSqrt[ymax * IMAGE_WIDTH + xmin - ];
sqdiff = sqdiagsum - sqidiagsum;
}
mean = diff / area;
std = sqrt((sqdiff - diff*diff / area) / (area - ));
threshold = mean*( + k*((std / ) - ));
if (grayImage[j*IMAGE_WIDTH + i] < threshold)
biImage[j*IMAGE_WIDTH + i] = ;
else
biImage[j*IMAGE_WIDTH + i] = ;
}
}
free(integralImg);
free(integralImgSqrt);
sauvola是一种考虑局部均值亮度的图像二值化方法, 以局部均值为基准在根据标准差做些微调.算法实现上一般用积分图方法
来实现.这个方法能很好的解决全局阈值方法的短板—关照不均图像二值化不好的问题.
代码要注意下面几点:
1 计算区域像素和,几乎使用积分图技术是必然的选择.
2 标准差的表示方法: std = sqrt((sqdiff - diff*diff / area) / (area - )) 终于感到高等代数没有白学,
3 判定方程 threshold = mean*(1 + k*((std / 128) - 1)). 首先均值是基础, 如果标准差大写,阈值就会大些,标准差小些,阈值就会小些.
这个方法对一些不是光照不均的图片有时候效果不好,现在还在找较好的方法,初步打算先用全局均值做二值化,如何效果不好再用局部均值的方法.
以上转载自:
https://www.cnblogs.com/guopengfei/p/4766526.html
一种局部二值化算法:Sauvola算法的更多相关文章
- 【计算机视觉】纹理特征之LBP局部二值化模式
转自http://blog.csdn.NET/ty101/article/details/8905394 本文的PDF版本,以及涉及到的所有文献和代码可以到下列地址下载: 1.PDF版本以及文献:ht ...
- OpenCV_基于局部自适应阈值的图像二值化
在图像处理应用中二值化操作是一个很常用的处理方式,例如零器件图片的处理.文本图片和验证码图片中字符的提取.车牌识别中的字符分割,以及视频图像中的运动目标检测中的前景分割,等等. 较为常用的图像二值化方 ...
- 【转】Emgu CV on C# (五) —— Emgu CV on 局部自适应阈值二值化
局部自适应阈值二值化 相对全局阈值二值化,自然就有局部自适应阈值二值化,本文利用Emgu CV实现局部自适应阈值二值化算法,并通过调节block大小,实现图像的边缘检测. 一.理论概述(转载自< ...
- [转载+原创]Emgu CV on C# (五) —— Emgu CV on 局部自适应阈值二值化
局部自适应阈值二值化 相对全局阈值二值化,自然就有局部自适应阈值二值化,本文利用Emgu CV实现局部自适应阈值二值化算法,并通过调节block大小,实现图像的边缘检测. 一.理论概述(转载自< ...
- [转载+原创]Emgu CV on C# (四) —— Emgu CV on 全局固定阈值二值化
重点介绍了全局二值化原理及数学实现,并利用emgucv方法编程实现. 一.理论概述(转载,如果懂图像处理,可以略过,仅用作科普,或者写文章凑字数) 1.概述 图像二值化是图像处理中的一项基本技术,也 ...
- openCV_java 图像二值化
较为常用的图像二值化方法有:1)全局固定阈值:2)局部自适应阈值:3)OTSU等. 局部自适应阈值则是根据像素的邻域块的像素值分布来确定该像素位置上的二值化阈值.这样做的好处在于每个像素位置处的二值化 ...
- sauvola二值化算法研究
sauvola二值化算法研究 sauvola是一种考虑局部均值亮度的图像二值化方法, 以局部均值为基准在根据标准差做些微调.算法实现上一般用积分图方法 来实现.这个方法能很好的解决全局阈值方法的短 ...
- Wellner 自适应阈值二值化算法
参考文档: Adaptive Thresholding for the DigitalDesk.pdf Adaptive Thresholding Using the Integral I ...
- 《opencv学习》 之 OTSU算法实现二值化
主要讲解OTSU算法实现图像二值化: 1.统计灰度级图像中每个像素值的个数. 2.计算第一步个数占整个图像的比例. 3.计算每个阈值[0-255]条件下,背景和前景所包含像素值总个数和总概率(就 ...
随机推荐
- [USACO12FEB]牛券Cow Coupons(堆,贪心)
[USACO12FEB]牛券Cow Coupons(堆,贪心) 题目描述 Farmer John needs new cows! There are N cows for sale (1 <= ...
- Ubuntu 16.04 编译ORB_SLAM2_modified
编译g2o_with_orbslam2 1.修改g2o/types/slam2d/edge_se2_pointxy_bearing.cpp t.setRotation(t.rotation().ang ...
- oracle pl/sql 程序设计 历史笔记整理
20131016 周三 oracle pl/sql 程序设计 第2章 创建并运行pl/sql代码 sqlplus yjkhecc/yjkhecc@10.85.23.92:1521/orcl 在java ...
- Lengauer-Tarjan算法的相关证明
Lengauer-Tarjan算法的相关证明 0. 约定 为简单起见,下文中的路径均指简单路径(事实上非简单路径不会对结论造成影响). \(V\)代表图的点集,\(E\)代表图的边集,\(T\)代表图 ...
- SSM框架中IoC、DI与AOP的理解
框架封装了普通项目中程序员需要重复书写的代码和调用过程,就比如说在传统的jsp项目中,我们的controller接收到前端的请求然后程序员就需要去开发Dao层,里面还涉及数据库的连接和存储过程的代码, ...
- IPython的简单介绍
量化投资与Python 目录: 一.量化投资第三方相关模块 NumPy:数组批量计算 Pandas:表计算与数据分析 Matplotlib:图表绘制 二.IPython的介绍 IPython:和Pyt ...
- ZROI 19.07.29 线性代数入门/wq
1.高斯消元 在模意义下依然有效,对主元求逆即可. 甚至可以模合数,需要对两个方程辗转相除,复杂度\(O(n^3\log p)\). 辗转相除法只要能定义带余除法就有效. 逆矩阵:对于矩阵\(A\), ...
- mongodb数据库的改操作
原来字段: { "_id" : ObjectId("5df0a28e406405edeac5001f"), "username" : &qu ...
- LCA模板 ( 最近公共祖先 )
LCA 有几种经典的求取方法.这里只给出模板,至于原理我完全不懂. 1.RMQ转LCA.复杂度O(n+nlog2n+m) 大致就是 DFS求出欧拉序 => 对欧拉序做ST表 => LCA( ...
- window.location.hash(hash应用)---跳转到hash值制定的具体页面
location是javascript里边管理地址栏的内置对象,比如location.href就管理页面的url,用location.href=url就可以直接将页面重定向url.而location. ...