对于印刷体图片来说,进行水平投影和垂直投影可以很快的进行分割,本文就在OpenCV中如何进行水平投影和垂直投影通过代码进行说明。

水平投影:二维图像在y轴上的投影

垂直投影:二维图像在x轴上的投影

由于投影的图像需要进行二值化,本文采用积分二值化的方式,对图片进行处理。

具体代码如下:

 //积分二值化
 void thresholdIntegral (Mat inputMat, Mat& outputMat)
 {

     int nRows = inputMat.rows;
     int nCols = inputMat.cols;

     // create the integral image
     Mat sumMat;
     integral (inputMat, sumMat);

     ;
     double T = 0.15;

     // perform thresholding
     ;
     int x1, y1, x2, y2, count, sum;

     int* p_y1, *p_y2;
     uchar* p_inputMat, *p_outputMat;

     ; i < nRows; ++i)
     {
         y1 = i - s2;
         y2 = i + s2;

         )
         {
             y1 = ;
         }
         if (y2 >= nRows)
         {
             y2 = nRows - ;
         }

         p_y1 = sumMat.ptr<int> (y1);
         p_y2 = sumMat.ptr<int> (y2);
         p_inputMat = inputMat.ptr<uchar> (i);
         p_outputMat = outputMat.ptr<uchar> (i);

         ; j < nCols; ++j)
         {
             // set the SxS region
             x1 = j - s2;
             x2 = j + s2;

             )
             {
                 x1 = ;
             }
             if (x2 >= nCols)
             {
                 x2 = nCols - ;
             }

             count = (x2 - x1)* (y2 - y1);

             // I(x,y)=s(x2,y2)-s(x1,y2)-s(x2,y1)+s(x1,x1)
             sum = p_y2[x2] - p_y1[x2] - p_y2[x1] + p_y1[x1];

             if ((int) (p_inputMat[j] * count) < (int) (sum* (1.0 - T)))
             {
                 p_outputMat[j] = ;
             }
             else
             {
                 p_outputMat[j] = ;
             }
         }
     }
 }
 //垂直方向投影
 void picshadowx (Mat binary)
 {
     Mat paintx (binary.size(), CV_8UC1, Scalar ()); //创建一个全白图片,用作显示

     int* blackcout = new int[binary.cols];
     memset (blackcout, , binary.cols * );

     ; i < binary.rows; i++)
     {
         ; j < binary.cols; j++)
         {
             )
             {
                 blackcout[j]++; //垂直投影按列在x轴进行投影
             }
         }
     }
     ; i < binary.cols; i++)
     {
         ; j < blackcout[i]; j++)
         {
             paintx.at<uchar> (binary.rows--j, i) = ; //翻转到下面,便于观看
         }
     }
     delete blackcout;
     imshow ("paintx", paintx);

 }
 //水平方向投影并行分割
 void picshadowy (Mat binary)
 {
    //是否为白色或者黑色根据二值图像的处理得来
     Mat painty (binary.size(), CV_8UC1, Scalar ()); //初始化为全白

    //水平投影
    int* pointcount = new int[binary.rows]; //在二值图片中记录行中特征点的个数
     memset (pointcount, , binary.rows * );//注意这里需要进行初始化

     ; i < binary.rows; i++)
     {
         ; j < binary.cols; j++)
         {
             )
             {
                 pointcount[i]++; //记录每行中黑色点的个数 //水平投影按行在y轴上的投影
             }
         }
     }

     ; i < binary.rows; i++)
     {
         ; j < pointcount[i]; j++) //根据每行中黑色点的个数,进行循环
         {

             painty.at<uchar> (i, j) = ;
         }

     }

     imshow ("painty", painty);

     vector<Mat> result;
     ;
     ;
     bool inblock = false; //是否遍历到字符位置

     ; i < painty.rows; i++)
     {

         ) //进入有字符区域
         {
             inblock = true;
             startindex = i;
             cout << "startindex:" << startindex << endl;
         }
         ) //进入空白区
         {
             endindex = i;
             inblock = false;
             Mat roi = binary.rowRange (startindex, endindex+); //从而记录从开始到结束行的位置,即可进行行切分
             result.push_back (roi);
         }
     }

     ; i < result.size(); i++)
     {
         Mat tmp = result[i];
         imshow ("test"+to_string (i), tmp);
      }
     delete pointcount;

 }
 int main (int argc, char* argv[])
 {

       Mat src = cv::imread ("test.jpg");

         if (src.empty())
         {
             cerr << "Problem loading image!!!" << endl;
             ;
         }

         imshow("in",src);

         Mat gray;

         )
         {
             cv::cvtColor (src, gray, CV_BGR2GRAY);
         }
         else
         {
             gray = src;
         }

         Mat bw2 = Mat::zeros (gray.size(), CV_8UC1);
         thresholdIntegral (gray, bw2);

         cv::imshow ("binary integral", bw2);

         //picshadowx (bw2);
         picshadowy (bw2);
         waitKey ();

     ;
 }

输入图片:

二值图片:

水平投影:

垂直投影:

行切割:

OpenCV 实现图片的水平投影与垂直投影,并进行行分割的更多相关文章

  1. python 对图片做垂直投影

    Python 对图片做垂直投影 本文利用opencv对图片进行垂直投影,做出垂直投影图,大体思路:打开图片,灰度化,二值化,按列进行统计,新建一个大小和原图一样的图片,按列进行填充: cv2.cv.G ...

  2. Python + opencv 实现图片文字的分割

    实现步骤: 1.通过水平投影对图形进行水平分割,获取每一行的图像: 2.通过垂直投影对分割的每一行图像进行垂直分割,最终确定每一个字符的坐标位置,分割出每一个字符: 先简单介绍一下投影法:分别在水平和 ...

  3. 用 Python 和 OpenCV 检测图片上的条形码

      用 Python 和 OpenCV 检测图片上的的条形码 这篇博文的目的是应用计算机视觉和图像处理技术,展示一个条形码检测的基本实现.我所实现的算法本质上基于StackOverflow 上的这个问 ...

  4. CSS实现文字和图片的水平垂直居中

    关于文字和图片的水平垂直居中,在前端界绝对算是一个老生常谈的问题了,尤其是垂直居中,什么千奇百怪的解法都能想的出来.下面我就总结一些比较常用的方法: 一.文本的水平垂直居中: 1.水平居中: 是不是很 ...

  5. mysql的水平拆分和垂直拆分

    转:http://www.cnblogs.com/sns007/p/5790838.html 1,水平分割: 例:QQ的登录表.假设QQ的用户有100亿,如果只有一张表,每个用户登录的时候数据库都要从 ...

  6. MYSQL水平拆分与垂直拆分

    目前很多互联网系统都存在单表数据量过大的问题,这就降低了查询速度,影响了客户体验.为了提高查询速度,我们可以优化sql语句,优化表结构和索引,不过对那些百万级千万级的数据库表,即便是优化过后,查询速度 ...

  7. * CSS 视觉格式化(基本框、包含块、盒模型、水平格式化、垂直格式化、行布局、em框、内容区、行间距、行内框、行框)

    前言 CSS视觉格式化这个词可能比较陌生,但说起盒模型可能就恍然大悟了.实际上,盒模型只是CSS视觉格式化的一部分.视觉格式化分为块级和行内两种处理方式.理解视觉格式化,可以确定得到的效果是应该显示的 ...

  8. mysql的水平拆分和垂直拆分 (转)

    http://www.cnblogs.com/sns007/p/5790838.html 1,水平分割: 例:QQ的登录表.假设QQ的用户有100亿,如果只有一张表,每个用户登录的时候数据库都要从这1 ...

  9. mysql数据库的水平拆分与垂直拆分

    近端时间在面试,发现很多面试官或者面试都把数据的水平拆分合垂直拆分给搞混了,今天特意写了一篇博客来说说水平拆分和垂直拆分希望对程序猿们有所帮助. 数据库水平与垂直拆分: 垂直(纵向)拆分:是指按功能模 ...

随机推荐

  1. Leetcode题解(一)

    1.Two Sum 题目 此题第一解题思路,就是最常见的方法,两个指针嵌套遍历数组,依次判断当前指针所指向的值是否满足条件.代码如下; class Solution { public: vector& ...

  2. Paint the Grid Again (隐藏建图+优先队列+拓扑排序)

    Leo has a grid with N × N cells. He wants to paint each cell with a specific color (either black or ...

  3. jQuery选择器(表单元素过滤选择器)第八节

    <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4/stri ...

  4. HTTP中的Range: bytes=0-

    HTTP中的Range就是分段请求字节数,也是大家经常说的断点续传.Range头域可以请求实体的一个或者多个子范围,Range的值为0表示第一个字节,也就是Range计算字节数是从0开始的 表示第二个 ...

  5. vue-cli 前端开发,后台接口跨域代理调试问题

    使用 webpack的方式开发的时候,前台开发过程中需要调用很多后台的数据接口,但是通常前后台分离的开发方式,后台的接口数据很可能是不方便或者是不能在前端同学的电脑上运行的,也就出现了所谓的跨域问题. ...

  6. java与OC比较

    转自:http://blog.sina.com.cn/s/blog_93742d0d010165qi.html 1.Cocoa是什么?Cocoa是使用OC语言编写的工具包,里面有大量的类库.结构体,说 ...

  7. Hadoop 2.2.0单节点的伪分布集成环境搭建

    Hadoop版本发展历史 第一代Hadoop被称为Hadoop 1.0 1)0.20.x 2)0.21.x 3)0.22.x 第二代Hadoop被称为Hadoop 2.0(HDFS Federatio ...

  8. selenium元素定位

    在网页自动化测试中,我们要让程序自动模拟我们的点击.输入.悬浮.拖动等操作,完成我们的测试用例组. 输入.点击.打开这样的动词,已经包含在了selenium的方法中,可以直接调用(当然你也可以自己写) ...

  9. 【Arduino】2017年电子设计大赛B题 滚球控制系统|板球系统

    今年电赛我们队伍选择的是B题,滚球控制系统.最后我们得到了省特和国一,也算是了结了我大一时的心愿吧.下面对这次比赛进行一下总结,以后回忆起来的时候也有个念想. 滚球控制系统是一个多变量.非线性控制对象 ...

  10. Docker Swarm 中最重要的概念- 每天5分钟玩转 Docker 容器技术(94)

    从主机的层面来看,Docker Swarm 管理的是 Docker Host 集群.所以先来讨论一个重要的概念 - 集群化(Clustering). 服务器集群由一组网络上相互连接的服务器组成,它们一 ...