【OpenCV】一种基于阈值的图片中的文字分割

在今年泰迪杯A题电商中图片的文字识别这道题中，我们先用了一种很笨的办法来分割字符。
首先对图片进行灰度化，然后二值化，这里的二值化要选择一个合适的阈值。然后我们进行轮廓的提取，计算轮廓最小矩形的面积，若面积过大，则认为这个是背景图片，若面积过小，则认为是噪点。这种方法有一个弊端，就是文字有大有小，大的文字也有可能会被当成背景，小的标点也可能会被当成噪点。

代码如下：
实现了读入一张图片，进行灰度化，二值化，分割字符，输出字符.jpg到指定位置，以及输出字符最小矩形的坐标。

 const string imagename = "1.jpg";    //此处需要填写绝对地址，我测试时使用相对地址出错。

    //读入图像

    Mat img = imread(imagename);

    //如果读入图像失败

    if (img.empty())

    {

        return -1;

    }

    int Hmin = 0, Hmax = 156;

    int AreaMin = 15, AreaMax = 135;

    int Area = 200;

    //创建窗口

    cv::namedWindow("thresh");

    cv::createTrackbar("Hmin", "thresh", &Hmin, 255, NULL); cv::createTrackbar("Hmax", "thresh", &Hmax, 255, NULL);

    cv::createTrackbar("AreaMin", "thresh", &AreaMin, 200, NULL)；

     cv::createTrackbar("AreaMax", "thresh", &AreaMax, 200, NULL);

    cv::createTrackbar("Area", "thresh", &Area, 4000, NULL);

    for (;;){

        int _Hmin = Hmin, _Hmax = Hmax;

        int _AreaMin = AreaMin, _AreaMax = AreaMax;

        Mat HSV, thresh, GRAY,gray,src;

        //vector<Mat> channels;

        cvtColor(img, GRAY, CV_BGR2GRAY);

        //cvtColor(img, HSV, CV_BGR2HSV);

        //CV_BGR2GRAY转为灰度  CV_BGR2HSV转为HSV  CV_BGR2YUV转为YUV CV_BGR2YCrCb转为YCrCb

        //split(HSV, channels);

        // channels[2]=0;

        inRange(GRAY,

            cv::Scalar(MIN(_Hmin, _Hmax), MIN(0, 255), MIN(0, 255)),

            cv::Scalar(MAX(_Hmin, _Hmax), MAX(0, 255), MAX(0, 255)),     //scalar 中 （b，g，r，0) 即bgr 而非 rgb

            thresh);//color

        gray = GRAY;

        thresh = 255 - thresh;

        //cvShowImage("ThresholdImg", GRAY);

        dilate(thresh, thresh, NULL, cv::Point(-1, -1), 30);

        erode(thresh, thresh, NULL, cv::Point(-1, -1), 30);

        cv::imshow("thres", thresh);

        cv::waitKey(1);

        vector<cv::vector<cv::Point> > contours;

        vector<cv::Vec4i> hierarchy;

        // 找出图像中的最大轮廓

        findContours(thresh, contours, hierarchy, CV_RETR_TREE, CV_CHAIN_APPROX_SIMPLE, cv::Point(0, 0));

        // 定义一个 Rect 矢量来存放轮廓。因为轮廓的外形多数时候是不规则的。所以用一个矩形来代替 不规则的轮廓会在各种方面都方便很多。

        //printf("轮廓个数：%d", contours.size());

        cv::vector<cv::vector<cv::Point> > contours_poly(contours.size());

        cv::vector<cv::Rect> boundRect(contours.size());

        cv::vector<cv::Point2f>center(contours.size());

        cv::vector<float>radius(contours.size());

        int maxArea = 0;

        int index = 0;

        int minArea = 50;

        int ci = 0;

        for (unsigned int i = 0; i<contours.size(); i++)

            // 用一个 for 循环语句查看计算机找到的全部轮廓

        {

            int area = contourArea(contours[i]);// 计算当前轮廓的包含面积

            if (area> maxArea) // 找出包含面积最大的轮廓

            {

                maxArea = area;

                index = i;

            }

            if (area<_AreaMax&&area>_AreaMin)

            {

                ci++;

                approxPolyDP(cv::Mat(contours[i]), contours_poly[i], 3, true);

                // approxPolyDP() 用来找出轮廓的近似多边形。用于简化轮廓的复杂度,加速计算过程。

                boundRect[i] = cv::boundingRect(cv::Mat(contours_poly[i]));

                //BoundingRect() 是一个用来找出轮廓最小包围矩形函数。

                //最小包围矩形的意思就是用 4 条边从 上下左右四个方向把轮廓紧紧夹在中间。这 4 条边构成的矩形就是最小包围矩形。

                //drawContours(img, contours, i, CV_RGB(255, 255, 255), 1, 8, hierarchy, 0, cv::Point()); // 画出物体的轮廓

                rectangle(GRAY, boundRect[i].tl(), boundRect[i].br(), CV_RGB(255, 0, 0), 2, 8, 0); // 画出物体的最小包围矩形

                // 矩形的自然就是 boundRect() 算出的轮廓。

                //printf("左上角x坐标：%d左上角y坐标：%d ", boundRect[i].tl().x, boundRect[i].tl().y);

                //printf("右下角x坐标：%d右下角y坐标：%d ", boundRect[i].br().x,boundRect[i].br().y);

                printf("PA%dPA %d %d %d %d\n",i,boundRect[i].tl().x, boundRect[i].br().y, boundRect[i].br().x, boundRect[i].tl().y);

                //printf("左下角x坐标：%d左下角y坐标：%d 右上角x坐标：%d右上角y坐标：%d ", boundRect[i].tl().x, boundRect[i].br().y, boundRect[i].br().x, boundRect[i].tl().y);

                Mat imgROI = img(Rect(boundRect[i].tl().x, boundRect[i].tl().y, std::abs(boundRect[i].br().x - boundRect[i].tl().x), std::abs(boundRect[i].br().y - boundRect[i].tl().y)));

                CString _file;

                _file.Format("./test/%d.jpg", i+1);

                std::string path = _file;

                imwrite(path, imgROI);

            }

        }

        //printf("字数：%d", ci);

        //imshow("HSV", HSV);

        imshow("GRAY", GRAY);

        //创建窗口

        //显示图像

    //  namedWindow("SRC", 1);

        imshow("img", img);

        CString _file;

        _file.Format("gray.jpg");

        std::string path = _file;

        imwrite(path, GRAY);

    //  imshow("it", thresh);

        //等待按键，按键盘任意键返回

        waitKey(0);

    }

【OpenCV】一种基于阈值的图片中的文字分割的更多相关文章

C# 图片识别技术（支持21种语言，提取图片中的文字）
图片识别的技术到几天已经很成熟了,只是相关的资料很少,为了方便在此汇总一下(C#实现),方便需要的朋友查阅,也给自己做个记号. 图片识别的用途:很多人用它去破解网站的验证码,用于达到自动刷票或者是批量 ...
OpenCV几种边缘检测的简例
简单记录一下OpenCV的几种边缘检测函数的用法. 边缘检测算法以Sobel边缘检测算法为例. Sobel卷积核模板为: 偏导公式为: Gx(i,j)=[f(i+1,j−1)+2f(i+1,j)+f ...
[信安Presentation]一种基于GPU并行计算的MD5密码解密方法
-------------------paper--------------------- 一种基于GPU并行计算的MD5密码解密方法 0.abstract1.md5算法概述2.md5安全性分析3.基 ...
<<一种基于δ函数的图象边缘检测算法>>一文算法的实现。
原始论文下载: 一种基于δ函数的图象边缘检测算法. 这篇论文读起来感觉不像现在的很多论文,废话一大堆,而是直入主题,反倒使人觉得文章的前后跳跃有点大,不过算法的原理已经讲的清晰了. 一.原理 ...
16种基于 CSS3 & SVG 的创意的弹窗效果
在去年,我给大家分享了<基于 CSS3 的精美模态窗口效果>,而今天我要与大家分享一些新鲜的想法.风格和趋势变化,要求更加适合现代UI的不同的效果.这组新模态窗口效果包含了一些微妙的动画, ...
tmpfs:一种基于内存的文件系统
tmpfs是一种基于内存的文件系统, tmpfs有时候使用rm(物理内存),有时候使用swap(磁盘一块区域).根据实际情况进行分配. rm:物理内存.real memery的简称? 真实内存就是电脑 ...
一种基于重载的高效c#上图片添加文字图形图片的方法
在做图片监控显示的时候,需要在图片上添加文字,如果用graphics类绘制图片上的字体,实现图像上添加自定义标记,这种方法经验证是可行的,并且在visual c#2005 编程技巧大全上有提到,但是, ...
一种基于Qt的可伸缩的全异步C/S架构服务器实现（流浪小狗，六篇，附下载地址）
本文向大家介绍一种基于Qt的伸缩TCP服务实现.该实现针对C/S客户端-服务集群应用需求而搭建.连接监听.数据传输.数据处理均在独立的线程池中进行,根据特定任务不同,可安排负责监听.传输.处理的线程数 ...
一种基于Qt的可伸缩的全异步C/S架构server实现(一) 综述
本文向大家介绍一种基于Qt的伸缩TCP服务实现.该实现针对C/Sclient-服务集群应用需求而搭建. 连接监听.传输数据.数据处理均在独立的线程池中进行,依据特定任务不同,可安排负责监听.传输.处理 ...

随机推荐

http://codeforces.com/contest/834
A. The Useless Toy time limit per test 1 second memory limit per test 256 megabytes input standard i ...
util包里的一些类的使用
好几天没有更新我的博客了 .国庆放假出去玩了一趟,这回来应该收心回到我的事业上了,哈哈哈!废话不多说,开始学习吧!首先今天来学习一些例子,这些例子可以回顾假期遗忘的知识,还能提高自己的能力.程序也会相 ...
python之testcenter操作
一.设置python环境 1. 从以下路径中将StcPython.py文件拷贝出来 Linux: /Installdir/Spirent_TestCenter_4.xx/Spirent_TestCen ...
Linux vi 退出&保存/不保存
无论是否退出 vi,均可保存所做的工作.按 ESC 键,确定 vi 是否处于命令模式. 操作键入保存,但不退出vi :w 保存并退出vi ...
HDU 1219 AC Me
strlen能不用就不用 #include<cstdio> #include<cstdlib> #include<iostream> #include<alg ...
WPF控件在XP下获得焦点有虚线框
所有 Button.ListBox等控件获得焦点时有虚线框.如图:选中523这个按钮就出线虚框. 我在App.xaml中添加适应所有按钮的样式,无效 <Style TargetType=&qu ...
thrift例子：python客户端/java服务端
java服务端的代码请看上文. 1.说明: 这两篇文章其实解决的问题是,当使用python去访问大数据线上集群的时候,遇到两个问题: 1)python-hadoop和python-hive相关包链接不 ...
Linux目录结构详解（一）
Linux目录结构,在逻辑上所有目录只有一个顶点,即/(根目录),是所有目录的起点.根下面类似于一个倒挂着的树的结构. Linux目录按照类别组织: 应用程序 /usr/bin 数据文件,帮助/usr ...
Echarts数据可视化grid直角坐标系（xAxis、yAxis），开发全解+完美注释
全栈工程师开发手册 (作者:栾鹏) Echarts数据可视化开发代码注释全解 Echarts数据可视化开发参数配置全解 6大公共组件详解(点击进入): title详解. tooltip详解.toolb ...
【学习】ie-css3.htc---让ie8以下支持css3
学习了偶象大神的一篇文章:<让IE6/IE7/IE8浏览器支持CSS3属性>http://www.zhangxinxu.com/wordpress/?p=783 亲自实践了一下,主要是bo ...

【OpenCV】一种基于阈值的图片中的文字分割

【OpenCV】一种基于阈值的图片中的文字分割的更多相关文章

随机推荐

热门专题