最近研究C#相关的OCR技术，图像识别一般C和C++这种底层语言做的比较多，C#主要是依托一些封装好的组件进行调用，这里介绍三种身份证识别的方法。

一：调用大公司API接口，百度、云脉，文通科技都有相关的API介绍。

二：调用图像处理类库，EmguCV是OpenCV的一个跨平台的.Net封装，该封装也可以被编译到Mono平台和允许在Windows、Mac OS、Android、iPhone、iPad等多个平台上运行

三：调用Office2007 组件

一、证件识别API接口

以聚合数据中的API接口为例，因为官方API没有提供C#的调用方式，网址如下：证件识别接口

/// <summary>

/// 上传图片

/// </summary>

/// <returns></returns>

public static string CardUpload()

{

    try

    {

        string appkey = "网站自己申请的key"; //配置您申请的appkey

        HttpPostedFile file = HttpContext.Current.Request.Files[0];

        string url = "http://api2.juheapi.com/cardrecon/upload";

        var parameters = new Dictionary<string, string>();

        parameters.Add("key", appkey);

        parameters.Add("cardType", "2");

        string result = HttpPostData(url, 60000, "pic", file.InputStream, parameters);

        JObject info = JObject.Parse(JObject.Parse(result)["result"].ToString());

        var cardInfo = new

        {

            name = info["姓名"],

            card = info["公民身份号码"]

        };

        return cardInfo.ToJson();

    }

    catch (Exception ex)

    {

        return ex.ToString();

    }

}

/// <summary>

/// Post调用API

/// </summary>

/// <param name="url">api地址</param>

/// <param name="timeOut">访问超时时间</param>

/// <param name="fileKeyName">文件参数名</param>

/// <param name="file">文件流</param>

/// <param name="stringDict">参数列表</param>

/// <returns>结果集</returns>

private static string HttpPostData(string url, int timeOut, string fileKeyName,

                           Stream file, Dictionary<string, string> stringDict)

{

    string responseContent;

    var memStream = new MemoryStream();

    var webRequest = (HttpWebRequest)WebRequest.Create(url);

    // 边界符

    var boundary = "---------------" + DateTime.Now.Ticks.ToString("x");

    // 边界符

    var beginBoundary = Encoding.ASCII.GetBytes("--" + boundary + "\r\n");

    // 最后的结束符

    var endBoundary = Encoding.ASCII.GetBytes("--" + boundary + "--\r\n");

    // 设置属性

    webRequest.Method = "POST";

    webRequest.Timeout = timeOut;

    webRequest.ContentType = "multipart/form-data; boundary=" + boundary;

    //写入开始边界符

    memStream.Write(beginBoundary, 0, beginBoundary.Length);

    // 写入文件

    const string filePartHeader =

        "Content-Disposition: form-data; name=\"{0}\"; filename=\"{1}\"\r\n" +

         "Content-Type: application/octet-stream\r\n\r\n";

    var header = string.Format(filePartHeader, fileKeyName, "card.jpg");

    var headerbytes = Encoding.UTF8.GetBytes(header);

    memStream.Write(headerbytes, 0, headerbytes.Length);

    file.CopyTo(memStream);

    // 写入字符串的Key

    var stringKeyHeader = "\r\n--" + boundary +

                           "\r\nContent-Disposition: form-data; name=\"{0}\"" +

                           "\r\n\r\n{1}\r\n";

    foreach (byte[] formitembytes in from string key in stringDict.Keys

                                     select string.Format(stringKeyHeader, key, stringDict[key])

                                         into formitem

                                         select Encoding.UTF8.GetBytes(formitem))

    {

        memStream.Write(formitembytes, 0, formitembytes.Length);

    }

    // 写入最后的结束边界符

    memStream.Write(endBoundary, 0, endBoundary.Length);

    webRequest.ContentLength = memStream.Length;

    // 构造完毕，执行POST方法

    var requestStream = webRequest.GetRequestStream();

    memStream.Position = 0;

    var tempBuffer = new byte[memStream.Length];

    memStream.Read(tempBuffer, 0, tempBuffer.Length);

    memStream.Close();

    requestStream.Write(tempBuffer, 0, tempBuffer.Length);

    requestStream.Close();

    var httpWebResponse = (HttpWebResponse)webRequest.GetResponse();

    using (var httpStreamReader = new StreamReader(httpWebResponse.GetResponseStream(),

                                                    Encoding.GetEncoding("utf-8")))

    {

        responseContent = httpStreamReader.ReadToEnd();

    }

    httpWebResponse.Close();

    webRequest.Abort();

    return responseContent;

}

二、EmguCV类库调用

环境搭建

下载地址：EmguCV官网

在File类别下下载这个EXE，进行安装，安装后在目录下能找相应组件，还有些应用的案例。

C#进行识别，需进行图片二值化处理和OCR调用相关DLL可在我整理的地址下载：360云盘提取码：89f4

dll文件夹中的dll引用到C#项目中，x64，x86，tessdata对应OCR识别的类库和语言库，我tessdata中已添加中文语言包，将这三个文件夹放入程序执行文件夹中。

Demo

自己做的小Demo如图：身份证图片是百度上下载的

相关代码如下：

using System;

using System.Collections.Generic;

using System.ComponentModel;

using System.Data;

using System.Drawing;

using System.Linq;

using System.Text;

using System.Windows.Forms;

using Emgu.CV;

using Emgu.CV.OCR;

using Emgu.CV.Structure;

using System.IO;

namespace ImageManage

{

    public partial class Form1 : Form

    {

        Image<Gray, Byte> imageThreshold;

        public Form1()

        {

            InitializeComponent();

        }

        private void btn_convert_Click(object sender, EventArgs e)

        {

            //第一个参数是语言包文件夹的地址，不写默认在执行文件夹下

            Tesseract _ocr = new Tesseract("", "chi_sim", OcrEngineMode.TesseractOnly);

            _ocr.Recognize(imageThreshold);

            String text = _ocr.GetText();

            this.textBox1.Text = text;

        }

        private void pictureBox1_Click(object sender, EventArgs e)

        {

            OpenFileDialog of = new OpenFileDialog();

            of.Title = "请选择图片";

            if (of.ShowDialog() == DialogResult.OK)

            {

                string file = of.FileName;

                Image img = Image.FromFile(file);

                pictureBox1.Image = img;

            }

            Bitmap bitmap = (Bitmap)this.pictureBox1.Image;

            Image<Bgr, Byte> imageSource = new Image<Bgr, byte>(bitmap);

            Image<Gray, Byte> imageGrayscale = imageSource.Convert<Gray, Byte>();

            imageGrayscale = randon(imageGrayscale);

            imageThreshold = imageGrayscale.ThresholdBinary(new Gray(100), new Gray(255));

            this.pictureBox2.Image = imageThreshold.ToBitmap();

        }

        /// <summary>

        /// 旋转校正

        /// </summary>

        /// <param name="imageInput"></param>

        /// <returns></returns>

        private Image<Gray, Byte> randon(Image<Gray, Byte> imageInput)//图像投影旋转法倾斜校正子函数定义

        {

            int nwidth = imageInput.Width;

            int nheight = imageInput.Height;

            int sum;

            int SumOfCha;

            int SumOfChatemp = 0;

            int[] sumhang = new int[nheight];

            Image<Gray, Byte> resultImage = imageInput;

            Image<Gray, Byte> ImrotaImage;

            //20度范围内的调整

            for (int ang = -20; ang < 20; ang = ang + 1)

            {

                ImrotaImage = imageInput.Rotate(ang, new Gray(1));

                for (int i = 0; i < nheight; i++)

                {

                    sum = 0;

                    for (int j = 0; j < nwidth; j++)

                    {

                        sum += ImrotaImage.Data[i, j, 0];

                    }

                    sumhang[i] = sum;

                }

                SumOfCha = 0;

                for (int k = 0; k < nheight - 1; k++)

                {

                    SumOfCha = SumOfCha + (Math.Abs(sumhang[k] - sumhang[k + 1]));

                }

                if (SumOfCha > SumOfChatemp)

                {

                    resultImage = ImrotaImage;

                    SumOfChatemp = SumOfCha;

                }

            }

            return resultImage;

        }

    }

}

三、Office 2007组件

该组件免费而且识别度比较高。

环境搭建

Office 2007组件MODI，需要安装Ofiice2007，且由于兼容性需要安装补丁，SP1或者SP2都行，补丁下载地址如下：

SP1下载地址 SP2下载地址

安装后控制面板-->卸载或更新程序-->选择Office2007-->选择更改-->选择添加或修复功能-->弹出下面界面，运行相应组件。

将Office工具-->Microsoft Office Document Imaging 下的工具运行

在C#项目中引用Com组件即可：

如果Office组件应用不是在本地程序而需要部署在IIS上，还需将应用程序的应用池的权限设置为如下图所示：程序应用池-->高级设置-->标识

Demo

StringBuilder sb = new StringBuilder();

MODI.Document doc = new MODI.Document();

doc.Create(fullFileName);

MODI.Image image;

MODI.Layout layout;

doc.OCR(MODI.MiLANGUAGES.miLANG_CHINESE_SIMPLIFIED, true, true);  // 识别文字类型

for (int i = 0; i < doc.Images.Count; i++)

{

    image = (MODI.Image)doc.Images[i];

    layout = image.Layout;

    sb.Append(layout.Text);

}

以上即一些C#进行身份证识别的方法，可根据自己项目的不同需求进行选用。

C#身份证识别相关技术的更多相关文章

Android安卓身份证识别SDK
一.Android安卓身份证识别SDK应用背景这些年,随着互联网金融的极速发展,第三方支付.理财.P2P网贷.征信等APP应用成爆发式的增长,在众多APP中都涉及到对身份证信息的录入,如第三方支付. ...
baidu-aip-SDK node.js 身份证识别
最近项目中客户需要实现身份证识别功能,合理计划了之后决定使用百度ai的身份证识别. 身份证识别是文字识别的一种,类似的功能有很多比如驾驶证识别等等,原理都是相同的. 对于前端初学者来说,如果要实现这种 ...
JavaScript对SVG进行操作的相关技术
原文地址:http://www.ibm.com/developerworks/cn/xml/x-svgscript/ 本文主要介绍在 SVG 中通过编程实现动态操作 SVG 图像的知识. SVG ...
身份证识别OCR，开启视频模式扫一扫即可识别身份证信息
文章摘要:身份证识别等证件识别OCR技术在各个行业得到广泛应用,例如:车险移动查勘会用到身份证识别.行驶证识别.车架号识别: 寿险移动展业会用到名片识别.银行卡识别:电信实名制代理网点采集身份证信息会 ...
百度OCR文字识别-身份证识别
简介一.介绍身份证识别 API 接口文档地址:http://ai.baidu.com/docs#/OCR-API/top 接口描述用户向服务请求识别身份证,身份证识别包括正面和背面. 请求说明 ...
SLAM+语音机器人DIY系列：（七）语音交互与自然语言处理——1.语音交互相关技术
摘要这一章将进入机器人语音交互的学习,让机器人能跟人进行语音对话交流.这是一件很酷的事情,本章将涉及到语音识别.语音合成.自然语言处理方面的知识.本章内容: 1.语音交互相关技术 2.机器人语音交互 ...
Android Study 玩转百度ocr身份证识别不是梦~
前言 Today,由于昨晚喝蒙了,今天晕乎乎的为大家带来如何快速集入ocr身份证识别. 关于ocr的前世今生这里不做过多的说明,百度一抓一大把. 前期准备百度AI开放平台ocr地址: https:/ ...
开发ActiveX控件调用另一个ActiveX系列0——身份证识别仪驱动的问题
程序员要从0下表开始,这篇是介绍这个系列的背景的,没有兴趣的人可以直接跳过. 为什么要开发ActiveX控件由于工作需要,我们开发了一个网站,使用了一款身份证识别仪的网页ActiveX(OCX)插件 ...
TCP-IP-part7-IP协议相关技术（一）
仅凭IP是无法完成通信的,需要一些IP的辅助技术.这些技术的包格式可能不一样,但它们都是基于IP地址进行的,都是通过匹配路由表来进行的,只是功能不一样.例如DHCP分配IP地址,它只管通知这条信息,具 ...

随机推荐

SSTable 介绍（一）
如果说Protocol Buffers是Google内部表示独立数据记录的单元,那么排序的字符串表--Sorted String Table(SSTable)--是存储,处理和交换数据集的最流行的输出 ...
如何在 IIS 上搭建 mercurial server
mercurial server 对于代码管理工具,更多的人可能更熟悉 Git 一些(Git 太火了).其实另外一款分布式代码管理工具也被广泛的使用,它就是 mercurial.多人协作时,最好能够通 ...
Open Source Cassandra Gitbook for Developer
Just released an open source Cassandra Gitbook for developer. http://teddymaef.github.io/learncassan ...
swagger:The World's Most Popular Framework for APIs.
swagger官网:http://swagger.io/ swagger ui demo:http://petstore.swagger.io 让API文档总是与API定义同步更新,是一件非常有价值的 ...
Redis总结笔记（二）：C#连接Redis简单例子
转载于:http://www.itxuexiwang.com/a/shujukujishu/redis/2016/0216/113.html?1455860686 注:C#在调用Redis是不要使用S ...
Oracle Redo 以及 Archived日志简述
Oracle通过Redo Archived实现数据的归档什么是Redo日志 Redo日志记录了数据的变更,用于在数据库出现故障后,进行数据恢复. 功能主要由三个组件实现:Redo Log Buffe ...
js判断函数是否存在、判断是否为函数
代码: <script type="text/javascript"> //判断是否为函数 try { if(typeof FunName === "func ...
学习ASP.NET MVC(二)——我的第一个ASP.NET MVC 控制器
MVC全称是Model View Controller,是模型(model)-视图(view)-控制器(controller)的缩写,是一种软件设计典范,用一种业务逻辑和数据显示分离的方法组织代码,将 ...
SilverLight 控件ListBox中的SelectionChanged事件
出现的问题: ListBox 中给了它一个这样的事件SelectionChanged="NumBasket_SelectionChanged" 也就是单击某行就会触发的事件,要实现 ...
【WP 8.1开发】文件选取器的使用方法
在以往的WP7x/8.0开发中,我们使用选择器可以浏览并打开图片.音频.视频等一些特殊文件,在8.0 SDK中的运行时API(从Win 8 app中移植)尽管提供了Windows.Storage.Pi ...

C#身份证识别相关技术

一、证件识别API接口

二、EmguCV类库调用

环境搭建

Demo

三、Office 2007组件

环境搭建

Demo

C#身份证识别相关技术的更多相关文章

随机推荐

热门专题