OpenCV图像处理中“投影技术”的使用

本文区分”问题引出“、”概念抽象“、”算法实现“三个部分由表及里具体讲解OpenCV图像处理中“投影技术”的使用，并通过”答题卡识别“”OCR字符分割”“压板识别”“轮廓展开分析”四个的例子具体讲解算法使用。使得读者能够对“投影技术”加速认识和理解，从而在解决具体问题的时候多一个有效方法。

内容将涉及如下：

1. “投影技术”的基本概念

2. “投影技术”的数学抽象

3. “投影技术”的算法实现

4. “投影技术”在“答题卡识别”场景下的使用

5. “投影技术”在“OCR 字符分割”场景下的使用

6. “投影技术”在“压板识别”例子中的使用

7. “投影技术”在“树叶轮廓分析”中的使用

8. 如何在解决实际问题的时候采用灵活的方法

一、问题引出“

我第一次集中遇到需要“投影”技术解决的问题，是在“答题卡”项目中。

标准图	实际采集图

在这样采集到的图像中，大量存在黑色的定位区块：

如果进一步定位，可以得到这样的结果：

如果做成连续图像

在这波峰波谷中，存在着的“量化”结果，对应了答题卡中的定位关系。

二、概念抽象

在前面的分析里，我们已经基本建立起“投影”的概念。从离散的角度来说，也就是:

局部最大值：F(x)>F(x−1)且F(x)>F(x+1)

局部最小值：F(x)<F(x−1)且F(x)<F(x+1)

类似于求极值、求切线等的情况。

三、算法实现



//投影到x或Y轴上,上波形为vup,下波形为vdown,gap为误差间隔

void projection2(Mat src,vector<int>& vup,vector<int>& vdown,int direction = DIRECTION_X,int gap = 10);

void projection2(Mat src, vector<int>& vup, vector<int>& vdown, int direction, int gap) {
    Mat tmp = src.clone();
    vector<int> vdate;
    if (DIRECTION_X == direction) {
        for (int i = 0; i < tmp.cols; i++) {
            Mat data = tmp.col(i);
            int itmp = countNonZero(data);
            vdate.push_back(itmp);
        }
    }
    else {
        for (int i = 0; i < tmp.rows; i++) {
            Mat data = tmp.row(i);
            int itmp = countNonZero(data);
            vdate.push_back(itmp);
        }
    }
    //整形,去除长度小于gap的零的洞
    if (vdate.size() <= gap)
        return;
    for (int i = 0; i < vdate.size() - gap; i++) {
        if (vdate[i] > 0 && vdate[i + gap] > 0) {
            for (int j = i; j < i + gap; j++) {
                vdate[j] = 1;
            }
            i = i + gap - 1;
        }
    }
    //记录上下沿
    for (int i = 1; i < vdate.size(); i++) {
        if (vdate[i - 1] == 0 && vdate[i] > 0)
            vup.push_back(i);
        if (vdate[i - 1] > 0 && vdate[i] == 0)
            vdown.push_back(i);
    }
}

在具体使用过程中，注意相关控制变量的管理。

四、问题迁移

1、OCR字符分割

通过看字符的特点，里面加了一些单个点的干扰，可以通过纵向投影来过滤，编写代码，查看特征

在这样的OCR识别中，首先可以通过投影的方法，实现字符的分割。

2、

压板识别

在这样的项目中，同样可以通过投影的方法，获得各个压板的准确定位。

3、轮廓展开分析

在类似树叶这样的测量中，可以通过“极坐标转换”，将树叶的这样的曲线转换成可以分析的投影，从而得到比如“树叶有多少个分叉”“有无缺陷”这样的定量信息。

来自为知笔记(Wiz)

OpenCV图像处理中“投影技术”的使用的更多相关文章

OpenCV图像处理中的“机器学习"技术的使用
注意,本文中所指"机器学习"(ML)技术,特指SVM.随机森林等"传统"技术. 一.应用场景相比较当下发展迅速的各路"端到端" ...
OpenCV图像处理中常用函数汇总（1）
//俗话说:好记性不如烂笔头 //用到opencv 中的函数时往往会一时记不起这个函数的具体参数怎么设置,故在此将常用函数做一汇总: Mat srcImage = imread("C:/Us ...
OpenCV图像处理中常用函数汇总（2）
// 霍夫线变换 hough vector<Vec2f> lines;//定义一个矢量结构lines用于存放得到的线段矢量集合 HoughLines(dstImage,lines,,CV_ ...
paper 119：[转]图像处理中不适定问题-图像建模与反问题处理
图像处理中不适定问题作者:肖亮博士发布时间:09-10-25 图像处理中不适定问题(ill posed problem)或称为反问题(inverse Problem)的研究从20世纪末成为国际上的 ...
Zedboard甲诊opencv图像处理（三）
整个工程进展到这一步也算是不容易吧,但技术含量也不怎么高,中间乱起八糟的错误太烦人了,不管怎么样,现在面临了最大的困难吧,图像处理算法.算法确实不好弄啊,虽然以前整过,但都不是针对图像的. 现在的图像 ...
Python+OpenCV图像处理（八）—— 图像直方图
直方图简介:图像的直方图是用来表现图像中亮度分布的直方图,给出的是图像中某个亮度或者某个范围亮度下共有几个像素.还不明白?就是统计一幅图某个亮度像素数量.比如对于灰度值12,一幅图里面有2000 个像 ...
OpenCV图像处理篇之边缘检测算子
OpenCV图像处理篇之边缘检测算子转载: http://xiahouzuoxin.github.io/notes/ 3种边缘检测算子一阶导数的梯度算子高斯拉普拉斯算子 Canny算子 Open ...
Python+OpenCV图像处理（十四）—— 直线检测
简介: 1.霍夫变换(Hough Transform) 霍夫变换是图像处理中从图像中识别几何形状的基本方法之一,应用很广泛,也有很多改进算法.主要用来从图像中分离出具有某种相同特征的几何形状(如,直线 ...
Python+OpenCV图像处理（九）—— 模板匹配
百度百科:模板匹配是一种最原始.最基本的模式识别方法,研究某一特定对象物的图案位于图像的什么地方,进而识别对象物,这就是一个匹配问题.它是图像处理中最基本.最常用的匹配方法.模板匹配具有自身的局限性, ...

随机推荐

Self-publishing 自出版
Self-publishing 自出版出书传统出版在过去的几十年中,发布意味着要经过代理商和发布者. 自出版如今,自助出版允许作者绕过出版商和书店,直接向公众出售. refs https:// ...
redux 中间件 redux-saga 使用教程
redux 中间件 redux-saga 使用教程 redux middleware refs https://redux-saga.js.org/docs/ExternalResources.htm ...
nest cli bug
nest cli bug Error: Collection "@nestjs/schematics" cannot be resolved. Error: Collection ...
千万不要错过VAST，NGK算力的下一个财富机会！
我们把目光投向NGK市场,近来,NGK接连新币,推出了SPC后,又有VAST.在目前市场上债券收益率已经趋近于零的情况下,世界上的大多数央行都在试图让本国货币贬值,所以在此时寻找其他保值资产是合理的. ...
SPC算力空投来袭！对话NGK！华盛顿金融特别报道
近日华盛顿金融时报联合波士顿商业报等多家知名金融媒体专访了NGK. NGK代表马特彼得森就表示NGK在新的一年里将会继续以生态建设者为中心,以打造高倍币孵化器为目标,不断推进NGK项目的落地,踏踏实实 ...
Masterboxan INC 下半年将聚焦超高净值和家族全权委托客户
"投资是一个没有终点的奋斗.我们不能简单的预测市场,而是应对市场做出正确的反应.这需要我们不断反思.总结.提升,找到自己的投资哲学,然后用一生的时间去坚守."Masterboxan ...
WPF权限控制——【3】数据库、自定义弹窗、表单验证
你相信"物竞天择,适者生存"这样的学说吗?但是我们今天却在提倡"尊老爱幼,救死扶伤",帮助并救护弱势群体:第二次世界大战期间,希特勒认为自己是优等民族,劣势民族 ...
Echarts制作一张全球疫情图
一.获取全球疫情数据 1)获取API 使用用友提供的新冠肺炎实时数据,登录注册之后可以免费使用. 2)点击用户信息这里的AIPCODE,复制并保存,用于后续的使用. 3)API的使用用友有提供一个 ...
Python学习笔记_爬虫数据存储为xlsx格式的方法
import requests from bs4 import BeautifulSoup import openpyxl wb=openpyxl.Workbook() sheet=wb.active ...
Vue学习笔记-django-cors-headers安装解决跨域问题
一使用环境: windows 7 64位操作系统二 jango-cors-headers安装解决跨域问题(后端解决方案) 跨域,指的是浏览器不能执行其他网站的脚本.它是由浏览器的同源策略造成的 ...

OpenCV图像处理中“投影技术”的使用

OpenCV图像处理中“投影技术”的使用的更多相关文章

随机推荐

热门专题