OpenCV 实现图片的水平投影与垂直投影,并进行行分割
对于印刷体图片来说,进行水平投影和垂直投影可以很快的进行分割,本文就在OpenCV中如何进行水平投影和垂直投影通过代码进行说明。
水平投影:二维图像在y轴上的投影
垂直投影:二维图像在x轴上的投影
由于投影的图像需要进行二值化,本文采用积分二值化的方式,对图片进行处理。
具体代码如下:
//积分二值化
void thresholdIntegral (Mat inputMat, Mat& outputMat)
{
int nRows = inputMat.rows;
int nCols = inputMat.cols;
// create the integral image
Mat sumMat;
integral (inputMat, sumMat);
;
double T = 0.15;
// perform thresholding
;
int x1, y1, x2, y2, count, sum;
int* p_y1, *p_y2;
uchar* p_inputMat, *p_outputMat;
; i < nRows; ++i)
{
y1 = i - s2;
y2 = i + s2;
)
{
y1 = ;
}
if (y2 >= nRows)
{
y2 = nRows - ;
}
p_y1 = sumMat.ptr<int> (y1);
p_y2 = sumMat.ptr<int> (y2);
p_inputMat = inputMat.ptr<uchar> (i);
p_outputMat = outputMat.ptr<uchar> (i);
; j < nCols; ++j)
{
// set the SxS region
x1 = j - s2;
x2 = j + s2;
)
{
x1 = ;
}
if (x2 >= nCols)
{
x2 = nCols - ;
}
count = (x2 - x1)* (y2 - y1);
// I(x,y)=s(x2,y2)-s(x1,y2)-s(x2,y1)+s(x1,x1)
sum = p_y2[x2] - p_y1[x2] - p_y2[x1] + p_y1[x1];
if ((int) (p_inputMat[j] * count) < (int) (sum* (1.0 - T)))
{
p_outputMat[j] = ;
}
else
{
p_outputMat[j] = ;
}
}
}
}
//垂直方向投影
void picshadowx (Mat binary)
{
Mat paintx (binary.size(), CV_8UC1, Scalar ()); //创建一个全白图片,用作显示
int* blackcout = new int[binary.cols];
memset (blackcout, , binary.cols * );
; i < binary.rows; i++)
{
; j < binary.cols; j++)
{
)
{
blackcout[j]++; //垂直投影按列在x轴进行投影
}
}
}
; i < binary.cols; i++)
{
; j < blackcout[i]; j++)
{
paintx.at<uchar> (binary.rows--j, i) = ; //翻转到下面,便于观看
}
}
delete blackcout;
imshow ("paintx", paintx);
}
//水平方向投影并行分割
void picshadowy (Mat binary)
{
//是否为白色或者黑色根据二值图像的处理得来
Mat painty (binary.size(), CV_8UC1, Scalar ()); //初始化为全白
//水平投影
int* pointcount = new int[binary.rows]; //在二值图片中记录行中特征点的个数
memset (pointcount, , binary.rows * );//注意这里需要进行初始化
; i < binary.rows; i++)
{
; j < binary.cols; j++)
{
)
{
pointcount[i]++; //记录每行中黑色点的个数 //水平投影按行在y轴上的投影
}
}
}
; i < binary.rows; i++)
{
; j < pointcount[i]; j++) //根据每行中黑色点的个数,进行循环
{
painty.at<uchar> (i, j) = ;
}
}
imshow ("painty", painty);
vector<Mat> result;
;
;
bool inblock = false; //是否遍历到字符位置
; i < painty.rows; i++)
{
) //进入有字符区域
{
inblock = true;
startindex = i;
cout << "startindex:" << startindex << endl;
}
) //进入空白区
{
endindex = i;
inblock = false;
Mat roi = binary.rowRange (startindex, endindex+); //从而记录从开始到结束行的位置,即可进行行切分
result.push_back (roi);
}
}
; i < result.size(); i++)
{
Mat tmp = result[i];
imshow ("test"+to_string (i), tmp);
}
delete pointcount;
}
int main (int argc, char* argv[])
{
Mat src = cv::imread ("test.jpg");
if (src.empty())
{
cerr << "Problem loading image!!!" << endl;
;
}
imshow("in",src);
Mat gray;
)
{
cv::cvtColor (src, gray, CV_BGR2GRAY);
}
else
{
gray = src;
}
Mat bw2 = Mat::zeros (gray.size(), CV_8UC1);
thresholdIntegral (gray, bw2);
cv::imshow ("binary integral", bw2);
//picshadowx (bw2);
picshadowy (bw2);
waitKey ();
;
}
输入图片:

二值图片:

水平投影:

垂直投影:

行切割:


OpenCV 实现图片的水平投影与垂直投影,并进行行分割的更多相关文章
- python 对图片做垂直投影
Python 对图片做垂直投影 本文利用opencv对图片进行垂直投影,做出垂直投影图,大体思路:打开图片,灰度化,二值化,按列进行统计,新建一个大小和原图一样的图片,按列进行填充: cv2.cv.G ...
- Python + opencv 实现图片文字的分割
实现步骤: 1.通过水平投影对图形进行水平分割,获取每一行的图像: 2.通过垂直投影对分割的每一行图像进行垂直分割,最终确定每一个字符的坐标位置,分割出每一个字符: 先简单介绍一下投影法:分别在水平和 ...
- 用 Python 和 OpenCV 检测图片上的条形码
用 Python 和 OpenCV 检测图片上的的条形码 这篇博文的目的是应用计算机视觉和图像处理技术,展示一个条形码检测的基本实现.我所实现的算法本质上基于StackOverflow 上的这个问 ...
- CSS实现文字和图片的水平垂直居中
关于文字和图片的水平垂直居中,在前端界绝对算是一个老生常谈的问题了,尤其是垂直居中,什么千奇百怪的解法都能想的出来.下面我就总结一些比较常用的方法: 一.文本的水平垂直居中: 1.水平居中: 是不是很 ...
- mysql的水平拆分和垂直拆分
转:http://www.cnblogs.com/sns007/p/5790838.html 1,水平分割: 例:QQ的登录表.假设QQ的用户有100亿,如果只有一张表,每个用户登录的时候数据库都要从 ...
- MYSQL水平拆分与垂直拆分
目前很多互联网系统都存在单表数据量过大的问题,这就降低了查询速度,影响了客户体验.为了提高查询速度,我们可以优化sql语句,优化表结构和索引,不过对那些百万级千万级的数据库表,即便是优化过后,查询速度 ...
- * CSS 视觉格式化(基本框、包含块、盒模型、水平格式化、垂直格式化、行布局、em框、内容区、行间距、行内框、行框)
前言 CSS视觉格式化这个词可能比较陌生,但说起盒模型可能就恍然大悟了.实际上,盒模型只是CSS视觉格式化的一部分.视觉格式化分为块级和行内两种处理方式.理解视觉格式化,可以确定得到的效果是应该显示的 ...
- mysql的水平拆分和垂直拆分 (转)
http://www.cnblogs.com/sns007/p/5790838.html 1,水平分割: 例:QQ的登录表.假设QQ的用户有100亿,如果只有一张表,每个用户登录的时候数据库都要从这1 ...
- mysql数据库的水平拆分与垂直拆分
近端时间在面试,发现很多面试官或者面试都把数据的水平拆分合垂直拆分给搞混了,今天特意写了一篇博客来说说水平拆分和垂直拆分希望对程序猿们有所帮助. 数据库水平与垂直拆分: 垂直(纵向)拆分:是指按功能模 ...
随机推荐
- velocity的基础使用
velocity的基本使用要求:掌握jsp的jstl技术,因为velocity的用法和jstl非常相似.语法上差别不大,但是velocity的示例明显比jstl少,解释也少,所以使用velocity必 ...
- js让input失去焦点
要求:当我点击页面非文本框的地方,令文本框失去焦点 问题:一开始我的做法是让点击的地方得到焦点,实际上是无效的 $(this).focus(); 当时我也不知道为什么focus会失效, 问题在于f ...
- python3.0 模拟用户登录,三次错误锁定
# -*- coding:utf-8 -*- #需求模拟用户登录,超过三次错误锁定不允许登陆 count = 0 #realname passwd Real_Username = &quo ...
- 【机器学习实战】第13章 利用 PCA 来简化数据
第13章 利用 PCA 来简化数据 降维技术 场景 我们正通过电视观看体育比赛,在电视的显示器上有一个球. 显示器大概包含了100万像素点,而球则可能是由较少的像素点组成,例如说一千个像素点. 人们实 ...
- phpstudy APACHE支持.htaccess以及 No input file specified解决方案
APACHE支持.htaccess以及 No input file specified解决方案 你的Apache安装文件夹conf里找到httpd.conf文件 索LoadModule rewrite ...
- GCC 中的编译器堆栈保护技术
GCC 中的编译器堆栈保护技术 前几天看到的觉得不错得博客于是转发了,但这里我补充一下一些点. GCC通过栈保护选项-fstack-protector-all编译时额外添加两个符号,__stack_c ...
- android 人脸检测你一定会遇到的坑
笔者今年做了一个和人脸有关的android产品,主要是获取摄像头返回的预览数据流,判断该数据流是否包含了人脸,有人脸时显示摄像头预览框,无人脸时摄像头预览框隐藏,看上去这个功能并不复杂,其实在开发过程 ...
- 【OpenCV】通过ROI区域以及掩码实现图像叠加
在图像处理领域,我们常常需要设置感兴趣区域(ROI,region of interest),来专注或者简化我们的工作过程 .也就是从图像中选择的一个图像区域,这个区域是我们图像分析所关注的重点.我们圈 ...
- Velocity(3)——#set指令
引用可以让模板设计者生成动态内容,而指令允许设计者真正的负责页面的展现和内容. 指令是以#开头,后面紧跟一个关键字,比如if,else,foreach等.而这个关键字,是可以被放在{}中间的.这是规范 ...
- 深入探讨List<>中的一个姿势。
List<>是c#中很常见的一种集合形式,近期在阅读c#源码时,发现了一个很有意思的定义: [DebuggerTypeProxy(typeof(Mscorlib_CollectionDeb ...