前言

使用opencv对图像进行操作，要求：（1）定位银行票据的四条边，然后旋正。（2）根据版面分析，分割出小写金额区域。

图像校正

首先是对图像的校正

读取图片
对图片二值化
进行边缘检测
对边缘的进行霍夫曼变换
将变换结果从极坐标空间投影到笛卡尔坐标得到倾斜角
根据倾斜角对主体校正

import os

import cv2

import math

import numpy as np

from scipy import ndimage

filepath = './task1-misc/'

filename = 'bank-bill.bmp'

filename_correct = 'bank-bill-correct.png'

def image_correction(input_path: str, output_path: str) -> bool:

    # 读取图像

    img = cv2.imread(input_path)

    # 二值化

    gray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)

    # 边缘检测

    edges = cv2.Canny(gray,50,150,apertureSize = 3)

    #霍夫变换

    lines = cv2.HoughLines(edges,1,np.pi/180,0)

    for rho,theta in lines[0]:

        a = np.cos(theta)   # 将极坐标转换为直角坐标

        b = np.sin(theta)

        x0 = a*rho

        y0 = b*rho

        x1 = int(x0 + 1000*(-b))    # 保证端点够远能够覆盖整个图像

        y1 = int(y0 + 1000 * a)

        x2 = int(x0 - 1000*(-b))

        y2 = int(y0 - 1000 * a)

        if x1 == x2 or y1 == y2:

            continue

        t = float(y2-y1)/(x2-x1)

        # 得到角度后将角度范围调整至-45至45度之间

        rotate_angle = math.degrees(math.atan(t))

        if rotate_angle > 45:

            rotate_angle = -90 + rotate_angle

        elif rotate_angle < -45:

            rotate_angle = 90 + rotate_angle

        # 图像根据角度进行校正

        rotate_img = ndimage.rotate(img, rotate_angle)

        # 在图中画出线

        cv2.line(img, (x1, y1), (x2, y2), (0, 0, 255), 2)

        cv2.imwrite(filepath + 'marked-'+filename_correct, img)

        # 输出图像

        cv2.imwrite(output_path, rotate_img)

        return True

input_path = filepath + filename

output_path = filepath + filename_correct

if image_correction(input_path, output_path):

    print("角度校正成功")

图（左）中的红线斜率和偏置是经过霍夫变换并进行极坐标转换后得到，后续将根据这条线进行角度的校正，校正后的结果如图（右）所示。

为了便于后续操作，我们选择将背景去掉，保存为.png图片。

filename_clear = 'bank-bill-clear.png'

# 去除背景

def remove_background(input_path: str, output_path: str) -> bool:

    # 读取图像

    img = cv2.imread(input_path, cv2.IMREAD_UNCHANGED)

    # 检查是否已经具有 alpha 通道，如果没有则创建一个

    if img.shape[2] == 3:

        alpha_channel = np.ones_like(img[:, :, 0], dtype=img.dtype) * 255

        img = np.dstack((img, alpha_channel))

    # 提取图像的 alpha 通道（透明度）

    alpha_channel = img[:, :, 3]

    # 将白色或黑色（背景）的像素设置为透明

    alpha_channel[(img[:, :, :3] == [255, 255, 255]).all(axis=2)] = 0

    alpha_channel[(img[:, :, :3] == [0, 0, 0]).all(axis=2)] = 0

    # 保存为带有透明通道的 PNG 图像

    cv2.imwrite(output_path, img)

    return True

input_path = filepath + filename_correct

output_path = filepath + filename_clear

if remove_background(input_path, output_path):

    print("去除背景成功")

版面分析与分割金额区域

使用opencv对图像进行版面分析得到表格线的投影。

def detectTable(img, save_path):

    gray_img = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

    thresh_img = cv2.adaptiveThreshold(~gray_img,255,cv2.ADAPTIVE_THRESH_MEAN_C,cv2.THRESH_BINARY,15,-2)

    h_img = thresh_img.copy()

    v_img = thresh_img.copy()

    scale = 20

    h_size = int(h_img.shape[1]/scale)

    h_structure = cv2.getStructuringElement(cv2.MORPH_RECT,(h_size,1)) # 形态学因子

    h_erode_img = cv2.erode(h_img,h_structure,1)

    h_dilate_img = cv2.dilate(h_erode_img,h_structure,1)

    # cv2.imshow("h_erode",h_dilate_img)

    v_size = int(v_img.shape[0] / scale)

    v_structure = cv2.getStructuringElement(cv2.MORPH_RECT, (1, v_size))  # 形态学因子

    v_erode_img = cv2.erode(v_img, v_structure, 1)

    v_dilate_img = cv2.dilate(v_erode_img, v_structure, 1)

    mask_img = h_dilate_img+v_dilate_img

    joints_img = cv2.bitwise_and(h_dilate_img,v_dilate_img)

    joints_img = cv2.dilate(joints_img,None,iterations=3)

    cv2.imwrite(os.path.join(save_path, "joints.png"),joints_img)

    cv2.imwrite(os.path.join(save_path, "mask.png"), mask_img)

    return joints_img, mask_img

img = cv2.imread(os.path.join(filepath, filename_clear))

_, mask_img = detectTable(img, save_path=filepath)

投影得到两张图，一张表示交叉点的投影，另一张表示表格线的投影，如下图所示，后续的边缘检测我们将用到右侧的图。

def find_bound(img):

    # 查找图像中的轮廓

    contours, _ = cv2.findContours(img, cv2.RETR_CCOMP, cv2.CHAIN_APPROX_TC89_L1)

    # 遍历所有轮廓

    site = []

    for contour in contours:

        # 计算边界矩形

        x, y, w, h = cv2.boundingRect(contour)

        if 20 < w < 35 and  20 <h < 35:

            site.append((x, y, w, h),)

    site.sort(key=lambda x: (x[0], x[1], x[2], x[3]))

    return site

site = find_bound(mask_img)

对mask.png，使用边缘检测，获取各个边缘的位置信息，根据所得的位置信息，在bank-bill-clear.png（对原图矫正角度并去除背景）中裁剪，并限制裁剪的图像块长宽在(20,35)的区间范围（实际尝试中并不能检测到金额区域的完整边缘，而是金额区域每个方形的边缘，(20,35)表示每个方形的长宽区间范围，如下图所示）。

save_path = './task1-result'

if os.path.exists(save_path) is False:

    os.makedirs(save_path)

for i in site:

    x, y, w, h = i

    cv2.imwrite(os.path.join(save_path, f"{x}-{y}-{w}-{h}.png"), img[y:y+h, x:x+w])

(x0, y0, w, h) = site[0]

x, y = x0+(w+2)*11, y0+h*2

cv2.imwrite(os.path.join(save_path, "res.png"), img[y0:y, x0:x])

对裁剪的图像块的坐标进行排序，推测出完整金额的具体位置，并再次裁剪，得到最后结果

运行环境

numpy==1.26.2

opencv_contrib_python==4.6.0.66

opencv_python==4.6.0.66

scipy==1.11.4

参考文献

基于OpenCV-Python的图像位置校正和版面分析的更多相关文章

Opencv python图像处理-图像相似度计算
一.相关概念一般我们人区分谁是谁,给物品分类,都是通过各种特征去辨别的,比如黑长直.大白腿.樱桃唇.瓜子脸.王麻子脸上有麻子,隔壁老王和儿子很像,但是儿子下巴涨了一颗痣和他妈一模一样,让你确定这是你 ...
Java基于opencv—透视变换矫正图像
很多时候我们拍摄的照片都会产生一点畸变的,就像下面的这张图虽然不是很明显,但还是有一点畸变的,而我们要做的就是把它变成下面的这张图效果看起来并不是很好,主要是四个顶点找的不准确,会有一些偏差,而且 ...
基于opencv+python的二维码识别
花了2天时间终于把二维码识别做出来了,不过效果一般,后面会应用在ROS辅助定位上,废话少说先上图: 具体过程参考了这位大神的博客:http://blog.csdn.net/qq_25491201/ar ...
opencv python：图像直方图 histogram
直接用matplotlib画出直方图 def plot_demo(image): plt.hist(image.ravel(), 256, [0, 256]) # image.ravel()将图像展开 ...
openCV—Python(5)—— 图像几何变换
一.函数简单介绍 1.warpAffine-图像放射变换(平移.旋转.缩放) 函数原型:warpAffine(src, M, dsize, dst=None, flags=None, borderMo ...
opencv python：图像梯度
一阶导数与Soble算子二阶导数与拉普拉斯算子图像边缘: Soble算子: 二阶导数: 拉普拉斯算子: import cv2 as cv import numpy as np # 图像梯度(由x, ...
opencv python：图像金字塔
图像金字塔原理 expand = 扩大+卷积拉普拉斯金字塔 PyrDown:降采样 PyrUp:还原 example import cv2 as cv import numpy as np # 图像 ...
opencv python：图像二值化
import cv2 as cv import numpy as np import matplotlib.pyplot as plt # 二值图像就是将灰度图转化成黑白图,没有灰,在一个值之前为黑, ...
opencv+python实现图像锐化
突然发现网上都是些太繁琐的方法,我就找opencv锐化函数咋这么墨迹. 直接上代码: kernel = np.array([[0, -1, 0], [-1, 5, -1], [0, -1, 0]], ...
Python图像处理丨基于OpenCV和像素处理的图像灰度化处理
摘要:本篇文章讲解图像灰度化处理的知识,结合OpenCV调用cv2.cvtColor()函数实现图像灰度操作,使用像素处理方法对图像进行灰度化处理. 本文分享自华为云社区<[Python图像处理 ...

随机推荐

技术文档 | OpenSCA技术原理之composer依赖解析
OpenSCA知识小课堂开课了! 今天主要介绍基于composer包管理器的组件成分解析原理. composer介绍 composer是PHP的依赖管理工具. 开发者受到Node.js的npm及Rub ...
基于阿里云Serverless函数计算开发的疫情数据统计推送机器人
一.Serverless函数计算什么是Serverless? 在<Serverless Architectures>中对 Serverless 是这样子定义的: Serverless w ...
关于el-upload上传图片的一些坑clearFiles()的使用
https://blog.csdn.net/weixin_46421824/article/details/109195624?spm=1001.2101.3001.6661.1&utm_me ...
freeswitch 新通话启动过程梳理
概述 freeswitch是一款开源的VOIP软交换平台,功能强大. 在使用fs进行呼叫业务的过程中,我们最常见到的日志就是呼叫通道的启动信息,日志如下 2022-03-03 14:14:30.028 ...
freeswitch的事件引擎实现分析
概述 freeswitch是由事件驱动的,fs内部有各种事件来标识状态的变化包括呼叫的变化.配置的变化.号码的变化等等. 而一个框架内的事件引擎需要实现哪些基本的功能呢? 让我们来看一下fs的事件引擎 ...
Mycat 实现分库分表及读写分离
本文为博主原创,未经允许不得转载: Mycat 官网: http://mycat.org.cn/ MyCat 权威指南文档:http://www.mycat.org.cn/document/myca ...
结构体中ElementType的使用
1.问题在定义结构体时,对于元素值,为什么喜欢使用ElementType而不是直接使用int或者char等等? 2.结论对于int get_result(int x); 和 int get_res ...
MoeCTF 2023(西电CTF新生赛)WP
个人排名签到 hello CTFer 1.题目描述: [非西电] 同学注意: 欢迎你来到MoeCTF 2023,祝你玩的开心! 请收下我们送给你的第一份礼物: https://cyberchef.o ...
[转帖]Jmeter创建简单的HTTP（S）请求测试-3
在上一章节中,介绍了Jmeter基本的组成组件,那么我们如何使用这些组件去完成测试呢,以下将通过创建一个简单的HTTP(S)测试进行说明,另外,除JDBC请求外,Jmeter进行测试构建的步骤大同小异 ...
[转帖]kafka搭建kraft集群模式
kafka2.8之后不适用zookeeper进行leader选举,使用自己的controller进行选举 1.准备工作准备三台服务器 192.168.3.110 192.168.3.111 192. ...

基于OpenCV-Python的图像位置校正和版面分析

前言

图像校正

版面分析与分割金额区域

参考文献

基于OpenCV-Python的图像位置校正和版面分析的更多相关文章

随机推荐

热门专题