效果

项目

代码

using System;

using System.Collections.Generic;

using System.ComponentModel;

using System.Data;

using System.Drawing;

using System.Linq;

using System.Text;

using System.Windows.Forms;

using OpenCvSharp;

using OpenCvSharp.Extensions;

namespace OpenCvSharp_提取文字区域

{

    public partial class Form1 : Form

    {

        public Form1()

        {

            InitializeComponent();

        }

        Mat mat;

        private void button1_Click(object sender, EventArgs e)

        {

            pictureBox1.Image = new Bitmap("test.jpg");

            mat = new Mat("test.jpg");

            Mat temp = Preprocess("test.jpg");

            pictureBox2.Image = FindTextRegion(temp);

        }

        public Bitmap FindTextRegion(Mat dilation)

        {

            // 1. 查找轮廓

            OpenCvSharp.Point[][] contours;

            HierarchyIndex[] hierarchly;

            Rect biggestContourRect = new Rect();

            Cv2.FindContours(dilation, out contours, out hierarchly, RetrievalModes.Tree, ContourApproximationModes.ApproxSimple);

            // 2. 筛选那些面积小的

            int i = 0;

            foreach (OpenCvSharp.Point[] contour in contours)

            {

                double area = Cv2.ContourArea(contour);

                //面积小的都筛选掉

                if (area < 1000)

                {

                    continue;

                }

                //轮廓近似，作用很小

                double epsilon = 0.001 * Cv2.ArcLength(contour, true);

                //找到最小的矩形

                biggestContourRect = Cv2.BoundingRect(contour);

                if (biggestContourRect.Height > (biggestContourRect.Width * 1.2))

                {

                    continue;

                }

                //画线

                mat.Rectangle(biggestContourRect, new Scalar(0, 255, 0), 2);

            }

            return mat.ToBitmap();

        }

        public Mat Preprocess(string imgPath)

        {

            Mat dilation2 = new Mat();

            //读取灰度图

            using (Mat src = new Mat(imgPath, ImreadModes.Grayscale))

            {

                //1.Sobel算子，x方向求梯度

                Mat sobel = new Mat();

                Cv2.Sobel(src, sobel, MatType.CV_8U, 1, 0, 3);

                //2.二值化

                Mat binary = new Mat();

                Cv2.Threshold(sobel, binary, 0, 255, ThresholdTypes.Otsu | ThresholdTypes.Binary);

                //3. 膨胀和腐蚀操作的核函数

                Mat element1 = new Mat();

                Mat element2 = new Mat();

                OpenCvSharp.Size size1 = new OpenCvSharp.Size(30, 9);

                OpenCvSharp.Size size2 = new OpenCvSharp.Size(24, 6);

                element1 = Cv2.GetStructuringElement(MorphShapes.Rect, size1);

                element2 = Cv2.GetStructuringElement(MorphShapes.Rect, size2);

                //4. 膨胀一次，让轮廓突出

                Mat dilation = new Mat();

                Cv2.Dilate(binary, dilation, element2);

                //5. 腐蚀一次，去掉细节，如表格线等。注意这里去掉的是竖直的线

                Mat erosion = new Mat();

                Cv2.Erode(dilation, erosion, element1);

                //6. 再次膨胀，让轮廓明显一些

                Cv2.Dilate(erosion, dilation2, element2, null, 3);

            }

            return dilation2;

        }

    }

}

Demo下载

C# OpenCvSharp 提取文字区域的更多相关文章

OpenCV入门笔记（七）文字区域的提取
https://blog.csdn.net/huobanjishijian/article/details/63685503 前面我们已经学了一些OpenCV中基本的图片处理的知识,可以拿来做一些小应 ...
mser 最大稳定极值区域(文字区域定位)算法附完整C代码
mser 的全称:Maximally Stable Extremal Regions 第一次听说这个算法时,是来自当时部门的一个同事, 提及到他的项目用它来做文字区域的定位,对这个算法做了一些优化. ...
ocr 文字区域检测及识别
ocr 文字区域检测及识别 # coding=utf- from PIL import Image, ImageFilter, ImageEnhance from skimage.filters im ...
C# 10分钟完成百度图片提取文字（文字识别）——入门篇
现在图片文字识别已经很成熟了,比如qq长按图片,点击图片识别就可以识别图片的文字,将不认识的.文字数量大的.或者不能赋值的值进行二次可复制功能. 我们现在就基于百度Ai开放平台进行个人文字识别,dem ...
Opencv2系列学习笔记10(提取连通区域轮廓)
连通区域指的是二值图像中相连像素组成的形状.而内.外轮廓的概念及opencv1中如何提取二值图像的轮廓见我的这篇博客:http://blog.csdn.net/lu597203933/article/ ...
Opencv2系列学习笔记10(提取连通区域轮廓) 另一个
http://blog.csdn.net/lu597203933/article/details/17362457 连通区域指的是二值图像中相连像素组成的形状.而内.外轮廓的概念及opencv1中如何 ...
Tesseract识别图片提取文字&字库训练
文中测试了3.0和4.0两个版本.发现3.0识别效率不准确,需要训练词库.4.0识别效率就比较高了,而且支持结果生成pdf.txt等格式.所以推荐使用4.0版本. 这个工具可以用在爬虫的时候获取验证码 ...
【Windows】免费图片提取文字的方法
今天意外的看到一个可以提取图片中文字的网站,自己试了下,提取效果还不错网址为: https://zhcn.109876543210.com/ 现在有图片如下我想从中提取的文字 1.打开网址,上传图 ...
EXCEL如何提取文字中包含的数字？
方法1:=IF(ISERROR(FIND("-",A1)),"","-")&MID(SUM(MID(101&A1,2+LAR ...
arcgis操作笔记-根据属性提取某区域要素
1. 提取

随机推荐

MutationObserver对象
MutationObserver对象 MutationObserver (W3C DOM4)对象提供了监视对DOM树所做更改的能力,其被设计为旧的Mutation Events功能的替代品(该功能是D ...
Java Solon v2.7.0 发布
Java Solon 是什么框架? Java "生态级"应用开发框架.从零开始构建,有自己的标准规范与开放生态.(历时七年,具备全球第二级别的生态规模) 相对于 Spring,有什 ...
Spring Cloud Openfeign微服务接口调用与Hystrix集成实战
关于openfeign 可以认为OpenFeign是Feign的增强版,不同的是OpenFeign支持Spring MVC注解.OpenFeign和Feign底层都内置了Ribbon负载均衡组件,在导 ...
使用 CMake 编写 Windows 静态库
最近有一个多个 .h .cc .cpp 编译成静态库的需求,故记录下过程静态库不同于动态库,它不需要 main 入口,只要各个源文件与头文件能对应,也就是源文件和头文件引用的头文件能够找到函数的符号 ...
std::async 与 std::thread 在什么时候使用比较合适
前提: C++ 11 中提供了多线程的标准库,提供了管理线程.保护共享数据.线程间同步操作.原子操作等类.多线程库对应的头文件是 #include <thread>,类名为 std::th ...
Redis原理再学习02：数据结构-动态字符串sds
Redis原理再学习:动态字符串sds 字符字符就是英文里的一个一个英文字母,比如:a.中文里的单个汉字,比如:好. 字符串就是多个字母或多个汉字组成,比如字符串:redis,中文字符串:你好吗. ...
centos7.5 hadoop NAT 静态IP网络环境搭建
1 设置 VMware 网络环境 1. 选择VMNet8 并将子网IP 修改为 192.168.10.0,保证集群ip都在这个网段下 2. 选择NAT 设置,配置NAT的网关为 192.168.10. ...
dataclass装饰器
简介根据定义dataclass时指"一个带有默认值的可变的namedtuple" 简单来说,就是你定义一个很普通的类,@dataclass装饰器可以帮你生成__repr__._ ...
网络安全-Linux常用命令
安装上传下载的软件包 yum install lrzsz -y 下载:linux-->windows sz -y /etc/hosts 上传:windows-->linux rz -y 系 ...
【LeetCode链表#12】链表相交
链表相交同:160.链表相交力扣题目链接(opens new window) 给你两个单链表的头节点 headA 和 headB ,请你找出并返回两个单链表相交的起始节点.如果两个链表没有交点,返 ...

C# OpenCvSharp 提取文字区域

效果

项目

代码

C# OpenCvSharp 提取文字区域的更多相关文章

随机推荐

热门专题