阿里云OCR图片转换成文字识别调用

using Newtonsoft.Json;

using System;

using System.Collections.Generic;

using System.Drawing;

using System.Drawing.Imaging;

using System.IO;

using System.Linq;

using System.Net;

using System.Net.Security;

using System.Security.Cryptography.X509Certificates;

using System.Text;

namespace Common.Utils

{

    public static class OCRUtil

    {

        private const String Host = "https://ocrapi-document.taobao.com";

        private const String Path = "/ocrservice/document";

        private const String Method = "POST";

        private const String Appcode = "************";

        private static readonly IList<string> ImageExList = new List<string>()

        {

            ".jpg",

            ".png",

            ".bmp"

        };

        /// <summary>

        /// 确保图片可用

        /// </summary>

        /// <param name="fileName"></param>

        private static void EnsureImageCanUse(string fileName)

        {

            if (string.IsNullOrWhiteSpace(fileName))

            {

                throw new ArgumentNullException(nameof(fileName), "文件名为空");

            }

            if (!File.Exists(fileName))

            {

                throw new FileNotFoundException("文件不存在", fileName);

            }

            string ex = System.IO.Path.GetExtension(fileName);

            if (ImageExList.IndexOf(ex.ToLower()) == -)

            {

                throw new FileFormatException("图片格式需为jpg，png，bmp");

            }

            FileInfo fileInfo = new FileInfo(fileName);

            if (fileInfo.Length >  *  * )

            {

                throw new Exception("文件不能大于4M");

            }

        }

        /// <summary>

        /// 将图片转换为Base64字符串

        /// </summary>

        /// <param name="fileName"></param>

        /// <returns></returns>

        private static string ImageToBase64String(string fileName)

        {

            Bitmap bitmap = new Bitmap(fileName);

            string ex = System.IO.Path.GetExtension(fileName).ToLower();

            using (MemoryStream ms = new MemoryStream())

            {

                ImageFormat format;

                switch (ex)

                {

                    case ".png":

                        format = ImageFormat.Png;

                        break;

                    case ".jpg":

                        format = ImageFormat.Jpeg;

                        break;

                    default:

                        format = ImageFormat.Bmp;

                        break;

                }

                bitmap.Save(ms, format);

                byte[] arr = new byte[ms.Length];

                ms.Position = ;

                ms.Read(arr, , (int)ms.Length);

                ms.Close();

                return Convert.ToBase64String(arr);

            }

        }

        /// <summary>

        /// 阿里云OCR图片转文字

        /// </summary>

        /// <param name="fileName"></param>

        /// <returns></returns>

        public static string ImageToText(string fileName)

        {

            EnsureImageCanUse(fileName);

            String querys = "";

            String bodys = "{\"img\":\"" + ImageToBase64String(fileName) + "\",\"url\":\"\",\"prob\":false}";

            String url = Host + Path;

            HttpWebRequest httpRequest = null;

            HttpWebResponse httpResponse = null;

            if ( < querys.Length)

            {

                url = url + "?" + querys;

            }

            if (Host.Contains("https://"))

            {

                ServicePointManager.ServerCertificateValidationCallback = new RemoteCertificateValidationCallback(CheckValidationResult);

                httpRequest = (HttpWebRequest)WebRequest.CreateDefault(new Uri(url));

            }

            else

            {

                httpRequest = (HttpWebRequest)WebRequest.Create(url);

            }

            httpRequest.Method = Method;

            httpRequest.Headers.Add("Authorization", "APPCODE " + Appcode);

            //根据API的要求，定义相对应的Content-Type

            httpRequest.ContentType = "application/json; charset=UTF-8";

            if ( < bodys.Length)

            {

                byte[] data = Encoding.UTF8.GetBytes(bodys);

                using (Stream stream = httpRequest.GetRequestStream())

                {

                    stream.Write(data, , data.Length);

                }

            }

            httpResponse = (HttpWebResponse)httpRequest.GetResponse();

            if (httpResponse.StatusCode != HttpStatusCode.OK)

            {

                throw new WebException("阿里云OCR接口调用识别失败");

            }

            Stream st = httpResponse.GetResponseStream();

            StreamReader reader = new StreamReader(st, Encoding.GetEncoding("utf-8"));

            string responseStr = reader.ReadToEnd();

            OcrResult ocrResult = JsonConvert.DeserializeObject<OcrResult>(responseStr);

            return OcrResultToString(ocrResult);

        }

        private static string OcrResultToString(OcrResult ocrResult)

        {

            StringBuilder sb = new StringBuilder();

            var wordList = ocrResult.prism_wordsInfo;

            foreach (var item in wordList)

            {

                int leftX = item.pos[].x;

                int blankSpaceCount = (int)Math.Floor((double)leftX / );

                if (blankSpaceCount > )

                {

                    sb.Append(' ', blankSpaceCount*);

                }

                sb.AppendLine(item.word);

            }

            return sb.ToString();

        }

        public static bool CheckValidationResult(object sender, X509Certificate certificate, X509Chain chain, SslPolicyErrors errors)

        {

            return true;

        }

    }

    /// <summary>

    /// OCR识别结果

    /// </summary>

    public class OcrResult

    {

        public string sid { get; set; }

        public string prism_version { get; set; }

        public int prism_wnum { get; set; }

        public List<Prism_Wordsinfo> prism_wordsInfo { get; set; }

        public int height { get; set; }

        public int width { get; set; }

        public int orgHeight { get; set; }

        public int orgWidth { get; set; }

    }

    public class Prism_Wordsinfo

    {

        public string word { get; set; }

        public IList<Pos> pos { get; set; }

    }

    public class Pos

    {

        public int x { get; set; }

        public int y { get; set; }

    }

}

阿里云OCR图片转换成文字识别调用的更多相关文章

利用百度AI OCR图片识别，Java实现PDF中的图片转换成文字
序言:我们在读一些PDF版书籍的时候,如果PDF中不是图片,做起读书笔记的还好:如果PDF中的是图片的话,根本无法编辑,做起笔记来,还是很痛苦的.我是遇到过了.我们搞技术的,当然得自己学着解决现在的痛 ...
使用阿里云的图片识别成表格ocr（将图片表格转换成excel）
为了简便财务总是要对照着别人发来的表格图片制作成自己的表格图片识别识别成表格表格识别 ocr 使用阿里云api 购买(印刷文字识别-表格识别) https://market.aliyun.com ...
ABBYY如何把图片转换成pdf格式
在制作工作文件的时候,有时候会遇到需要进行文件格式转换的情况,比较常见的文件格式转换就包含了Office与pdf格式之间的转换.但除此之外,图片与pdf格式也是可以进行转换的,那么图片要怎么操作,才能 ...
教你一招：Word中的文字转换成表格，把表格转换成文字
在使用office软件时,常常会在Word中加入表格,这时候我们一般想到的是,建立表格,然后一格一格的填写;或者用Excel表格制作在复制到Word文档中.其实在Word中就可以将文本文档转换成电子表 ...
UI进阶科大讯飞(1) 语音听写(语音转换成文字)
一.科大讯飞开放平台: http://www.xfyun.cn/ 注册.登录之后创建新应用. 因为本项目只实现了语音听写,所以在SDK下载中心勾选语音听写单项SDK就可以了开发平台选择iOS,应用选 ...
jpg、png格式的图片转换成webp后颜色失真的问题
今天简单的试用了一下 cweb.exe 将 jpg, png 格式的图片转换成 webp 格式. 我今天下载的是当前最新版:1.0.0 cwebp 3.jpg -q 85 -o 3.webp 发现图 ...
使用CSS将图片转换成黑白(灰色、置灰)z转
小tip: 使用CSS将图片转换成黑白(灰色.置灰) by zhangxinxu from http://www.zhangxinxu.com 本文地址:http://www.zhangxinxu.c ...
[转]C#将image中的显示的图片转换成二进制
本文转自:http://www.cnblogs.com/shuang121/archive/2012/07/09/2582654.html .将Image图像文件存入到数据库中我们知道数据库里的Im ...
小tip: 使用CSS将图片转换成模糊(毛玻璃)效果
去年盛夏之时,曾写过“小tip: 使用CSS将图片转换成黑白”一文,本文的模式以及内容其实走得是类似路线.CSS3 → SVG → IE filter → canvas. 前段时间,iOS7不是瓜未熟 ...

随机推荐

正向代理&反向代理简(fu)明(za)解释
最近写的东西越来越偏向Web程序员了··· 你想读懂本篇,就要知道什么是Web服务器——装在世界上某个机房里某台机器里某个操作系统里的一个,对外(公网或者你能访问)服务各种你需要的信息的软件! 它可以 ...
GIS之家小专栏
专栏简介:WebGIS开发者@GIS之家,一直混迹GIS行业,关注WebGIS开发方向,在本专栏中,分享WebGIS入门开发系列技术文章核心内容: arcgis api 3.x for js开发系列 ...
Git学习：如何在Github的README.MD文件下添加图片
格式如下: ![image](图片的绝对路径) 关于图片的绝对路径: 必须把图片上传到github的代码仓库里,再将其图片的网址复制到括号里才可以,不能够直接把图片复制到readme.md文件里面,这 ...
安卓开发笔记（十九）：异步消息处理机制实现更新软件UI
主界面代码 <?xml version="1.0" encoding="utf-8"?> <RelativeLayout xmlns:andr ...
Android JS桥交互（"Uncaught ReferenceError: xxx is not defined or xxx has no method"）
网上android和js交互的代码有不少,也很容易搜到.最近在做的项目需要用到js桥,遇到了一些问题,记录下来,希望以后遇到能马上解决掉. 一开始我找的demo是从这个:http://blog.csd ...
在离线环境中安装Visual Stuido 2017
在离线环境中安装Visual Stuido 2017 0x00 写在前面的废话因为工作上大多数都是在离线环境中进行的,进出离线环境很麻烦,所以之前很长一段时间都在使用VS2010.后来尝试换了VS2 ...
Netty3：分隔符和定长解码器
回顾TCP粘包/拆包问题解决方案上文详细说了TCP粘包/拆包问题产生的原因及解决方式,并以LineBasedFrameDecoder为例演示了粘包/拆包问题的实际解决方案,本文再介绍两种粘包/拆包问 ...
Uber是如何重新思考GPS定位的（尤其是在城市峡谷中）
郑昀(公众号:老兵笔记) 20180424 2018年4月19日,Uber 公布了 GPS 优化算法,https://eng.uber.com/rethinking-gps/,针对GPS定位在城市环境 ...
Docker & ASP.NET Core (3)：发布镜像
第一篇:把代码连接到容器第二篇:定制Docker镜像上一篇文章最后有个问题,定制的镜像无法正常运行: 这可能是由于无法找到要运行的dll引起的问题. 之前的Dockerfile的文档我是按照微软的 ...
【工利其器】必会工具之（三）systrace篇（2）
systrace工具打开路径以AndroidStudio(后面简写为AS),在顶部菜单栏中 Tools>Android>Android Device Monitor 打开后看到如下界面, ...

阿里云OCR图片转换成文字识别调用

阿里云OCR图片转换成文字识别调用的更多相关文章

随机推荐

热门专题