PaddleOCR学习笔记3-通用识别服务

今天优化了下之前的初步识别服务的python代码和html代码。

采用flask + paddleocr+ bootstrap快速搭建OCR识别服务。

代码结构如下：

模板页面代码文件如下：

upload.html :

<!DOCTYPE html>

<html>

<meta charset="utf-8">

<head>

    <title>PandaCodeOCR</title>

    <!--静态加载 样式-->

    <link rel="stylesheet" href={{ url_for('static',filename='bootstrap3/css/bootstrap.min.css') }}></link>

    <style>

        body {

            font-family: Arial, sans-serif;

            margin: 0;

            padding: 0;

        }

        .header {

            background-color: #f0f0f0;

            text-align: center;

            padding: 20px;

        }

        .title {

            font-size: 32px;

            margin-bottom: 10px;

        }

        .menu {

            list-style-type: none;

            margin: 0;

            padding: 0;

            overflow: hidden;

            background-color: #FFDEAD;

            border: 2px solid #DCDCDC;

        }

        .menu li {

            float: left;

            font-size: 24px;

        }

        .menu li a {

            display: block;

            color: #333;

            text-align: center;

            padding: 14px 16px;

            text-decoration: none;

        }

        .menu li a:hover {

            background-color: #ddd;

        }

        .content {

            padding: 20px;

            border: 2px solid blue;

        }

    </style>

</head>

<body>

<div class="header">

    <div class="title">PandaCodeOCR</div>

</div>

<ul class="menu">

    <li><a href="/upload/">通用文本识别</a></li>

</ul>

<div class="content">

    <!--上传图片文件-->

    <div id="upload_file">

        <form id="fileForm" action="/upload/" method="POST" enctype="multipart/form-data">

            <div class="form-group">

                <input type="file" class="form-control" id="upload_file" name="upload_file">

                <label class="sr-only" for="upload_file">上传图片</label>

            </div>

        </form>

    </div>

</div>

</div>

<div id="show" style="display: none;">

    <!--显示上传的图片-->

    <div class="col-md-6" style="border: 2px solid #ddd;">

        <span class="label label-info">上传图片</span>

        <!--静态加载 图片, url_for() 动态生成路径 -->

        <img src="" alt="Image preview area..." title="preview-img" class="img-responsive">

    </div>

    <div class="col-md-6" style="border: 2px solid #ddd;">

        <!--显示识别结果JSON报文列表-->

        <span class="label label-info">识别结果：</span>

        <!-- 结果显示区 -->

        <div id="result_show">加载中......</div>

    </div>

</div>

</body>

</html>

<!--静态加载 script-->

<script src={{ url_for('static',filename='jquery1.3.3/jquery.min.js') }}></script>

<script src={{ url_for('static',filename='js/jquery-form.js') }}></script>

<script type="text/javascript">

    var fileInput = document.querySelector('input[type=file]');

    var previewImg = document.querySelector('img');

    {#上传图片事件#}

    fileInput.addEventListener('change', function () {

        var file = this.files[0];

        var reader = new FileReader();

        //显示预览界面

        $("#show").css("display", "block");

        // 监听reader对象的的onload事件，当图片加载完成时，把base64编码賦值给预览图片

        reader.addEventListener("load", function () {

            previewImg.src = reader.result;

        }, false);

        // 调用reader.readAsDataURL()方法，把图片转成base64

        reader.readAsDataURL(file);

        //初始化输出结果信息

        $("#result_show").html("加载中......");

        {#上传图片识别表单事件，并显示识别结果信息#}

        {# ajaxSubmit 请求异步响应#}

        $("#fileForm").ajaxSubmit(function (data) {

            var inner = "";

            //alert(data['recognize_time'])

            //循环输出返回结果，响应识别结果为每行列表

            for (var i in data['result']) {

                var value = data['result'][i]['text'];

                inner += "<p class='text-left'>" + value + "</p>";

            }

            //清空输出结果信息

            $("#result_show").html("");

            //添加识别结果信息

            $("#result_show").append(inner);

        });

    }, false);

</script>

主要python代码文件如下：

myapp.py:

import json

import os

import time

from flask import Flask, render_template, request, jsonify

from paddleocr import PaddleOCR

from PIL import Image, ImageDraw

import numpy as np

# 应用名称，当前py名称，视图函数

app = Flask(__name__)

# 项目文件夹的绝对路径

# BASE_DIR = os.path.dirname(os.path.abspath(__name__))

# 相对路径

BASE_DIR = os.path.dirname(os.path.basename(__name__))

# 上传文件路径

UPLOAD_DIR = os.path.join(os.path.join(BASE_DIR, 'static'), 'upload')

'''

PaddleOCR模型通用识别方法

'''

def rec_model_ocr(img):

    # 返回字典结果对象

    result_dict = {'result': []}

    # paddleocr 目前支持的多语言语种可以通过修改lang参数进行切换

    # 例如`ch`, `en`, `fr`, `german`, `korean`, `japan`

    # 使用CPU预加载，不用GPU

    # 模型路径下必须包含model和params文件，目前开源的v3版本模型 已经是识别率很高的了

    # 还要更好的就要自己训练模型了。

    ocr = PaddleOCR(det_model_dir='./inference/ch_PP-OCRv3_det_infer/',

                    rec_model_dir='./inference/ch_PP-OCRv3_rec_infer/',

                    cls_model_dir='./inference/ch_ppocr_mobile_v2.0_cls_infer/',

                    use_angle_cls=True, lang="ch", use_gpu=False)

    # 识别图片文件

    result0 = ocr.ocr(img, cls=True)

    result = result0[0]

    for index in range(len(result)):

        line = result[index]

        tmp_dict = {}

        points = line[0]

        text = line[1][0]

        score = line[1][1]

        tmp_dict['points'] = points

        tmp_dict['text'] = text

        tmp_dict['score'] = score

        result_dict['result'].append(tmp_dict)

    return result_dict

# 转换图片

def convert_image(image, threshold=None):

    # 阈值 控制二值化程度，不能超过256，[200, 256]

    # 适当调大阈值，可以提高文本识别率，经过测试有效。

    if threshold is None:

        threshold = 200

    print('threshold : ', threshold)

    # 首先进行图片灰度处理

    image = image.convert("L")

    pixels = image.load()

    # 在进行二值化

    for x in range(image.width):

        for y in range(image.height):

            if pixels[x, y] > threshold:

                pixels[x, y] = 255

            else:

                pixels[x, y] = 0

    return image

@app.route('/')

def upload_file():

    return render_template('upload.html')

@app.route('/upload/', methods=['GET', 'POST'])

def upload():

    if request.method == 'POST':

        # 每个上传的文件首先会保存在服务器上的临时位置，然后将其实际保存到它的最终位置。

        filedata = request.files['upload_file']

        upload_filename = filedata.filename

        print(upload_filename)

        # 保存文件到指定路径

        # 目标文件的名称可以是硬编码的，也可以从 request.files[file] 对象的 filename 属性中获取。

        # 但是，建议使用 secure_filename() 函数获取它的安全版本

        if not os.path.exists(UPLOAD_DIR):

            os.makedirs(UPLOAD_DIR)

        img_path = os.path.join(UPLOAD_DIR, upload_filename)

        filedata.save(img_path)

        print('file uploaded successfully')

        start = time.time()

        print('=======开始OCR识别======')

        # 打开图片

        img1 = Image.open(img_path)

        # 转换图片, 识别图片文本

        # print('转换图片，阈值=220时，再转换为ndarray数组, 识别图片文本')

        # 转换图片

        img2 = convert_image(img1, 220)

        # Image图像转换为ndarray数组

        img_2 = np.array(img2)

        # 识别图片

        result_dict = rec_model_ocr(img_2)

        # 识别时间

        end = time.time()

        recognize_time = int((end - start) * 1000)

        result_dict["filename"] = upload_filename

        result_dict["recognize_time"] = str(recognize_time)

        result_dict["error_code"] = "000000"

        result_dict["error_msg"] = "识别成功"

        # render_template方法:渲染模板

        # 参数1: 模板名称  参数n: 传到模板里的数据

        # return render_template('result.html', result_dict=result_dict)

        # 将数据转换成JSON格式，一般用于ajax异步响应页面，不跳转页面用，等价下面方法

        # return json.dumps(result_dict, ensure_ascii=False), {'Content-Type': 'application/json'}

        # 将数据转换成JSON格式，一般用于ajax异步响应页面，不跳转页面用

        return jsonify(result_dict)

    else:

        return render_template('upload.html')

if __name__ == '__main__':

    # 启动app
　　 app.run(port=8000)

启动flask应用，测试结果如下：

PaddleOCR学习笔记3-通用识别服务的更多相关文章

多线程编程学习笔记——异步调用WCF服务
接上文多线程编程学习笔记——使用异步IO 接上文多线程编程学习笔记——编写一个异步的HTTP服务器和客户端接上文多线程编程学习笔记——异步操作数据库本示例描述了如何创建一个WCF服务,并宿主 ...
学习笔记TF058:人脸识别
人脸识别,基于人脸部特征信息识别身份的生物识别技术.摄像机.摄像头采集人脸图像或视频流,自动检测.跟踪图像中人脸,做脸部相关技术处理,人脸检测.人脸关键点检测.人脸验证等.<麻省理工科技评论&g ...
Binder学习笔记（九）—— 服务端如何响应Test()请求？
从服务端代码出发,TestServer.cpp int main() { sp < ProcessState > proc(ProcessState::self()); sp < I ...
matlab学习笔记10_5 通用字符串操作和比较函数
一起来学matlab-matlab学习笔记10 10_5 通用字符串操作和比较函数觉得有用的话,欢迎一起讨论相互学习~Follow Me 参考书籍 <matlab 程序设计与综合应用>张 ...
10月9日Android学习笔记：活动与服务之间的通信
最近在照着<第一行代码>这本书来学安卓,顺便记下笔记.主要的内容是Android中服务的第二种启动方式,通过活动绑定服务来启动服务,实现活动与服务之间的通信. 一. 首先创建一个服务类 p ...
Netty4 学习笔记之一:客户端与服务端通信 demo
前言因为以前在项目中使用过Mina框架,感受到了该框架的强大之处.于是在业余时间也学习了一下Netty.因为Netty的主要版本是Netty3和Netty4(Netty5已经被取消了),所以我就直接 ...
Netty4 学习笔记之四: Netty HTTP服务的实现
前言目前主流的JAVA web 的HTTP服务主要是 springMVC和Struts2,更早的有JSP/servlet. 在学习Netty的时候,发现Netty 也可以作HTTP服务,于是便将此整 ...
Docker学习笔记 - Docker客户端和服务端
学习内容: Docker客户端和服务端的通讯方式:client和自定义程序 Docker客户端和服务端的连接方式:socket 演示Docker客户端和服务端之间用remote-api通讯:nc ...
Webpack4 学习笔记七跨域服务代理
webpack 小插件使用 webpack 监听文件变化配置 webpack 处理跨域问题 Webpack 小插件使用 clean-webpack-plugin: 用于在生成之前删除生成文件夹的Web ...
iOS学习笔记06-手势识别
一.UIGestureRecognizer简单介绍我们已经学习了触摸事件处理,但触摸事件处理起来很麻烦,每个触摸事件处理都需要实现3个touches方法,比较繁琐,实际上我们可以使用更加简单的触摸事 ...

随机推荐

跟着源码一起学：手把手教你用WebSocket打造Web端IM聊天
本文作者芋艿,原题"芋道 Spring Boot WebSocket 入门",本次有修订和改动. 一.引言 WebSocket如今在Web端即时通讯技术应用里使用广泛,不仅用于传统 ...
macos(m1)编译测试深度学习推理框架
mnn build tnn
react中refs的使用
1.在dom元素中直接使用ref 意思就是可以在组件中创建一个dom节点的textInput,并将ref直接绑定到他 <script src="https://unpkg.com/@b ...
VScode配置X11转发！让你彻底摆脱显示屏！！！
作者:SkyXZ CSDN:SkyXZ--CSDN博客博客园:SkyXZ - 博客园在我们远程SSH使用开发板或者是服务器开发的时候,你是否总是苦于没有图像显示环境导致OpenCV的cv2.sho ...
oracle下批量增加序列值
感谢renjixinchina分享原文链接http://blog.itpub.net/15747463/viewspace-751593/ oracle下批量增加序列值.批量滚动序列 declare ...
从挑战到突破：HBlock定义智算存储新范式！
近日,由DOIT传媒主办,中国计算机学会信息存储专委会.武汉光电国家研究中心.百易存储研究院支持的2024中国数据与存储峰会在北京召开.此次峰会以"智数据 AI未来"为主题,天翼云 ...
nc命令-Netcat (网络刀)
https://blog.csdn.net/freeking101/article/details/53289198 nc参数 1) -l 用于指定nc将处于侦听模式.指定该参数,则意味着nc被当作s ...
Mac安装Hadoop
软件版本 hadoop3.2.1 一.打开本地ssh登录 # 生成公钥默认 $ ssh-keygen -t rsa -C "robots_wang@163.com" -b 4096 ...
win10安装MongoDB 5.0
1.首先去官网下载安装包:https://www.mongodb.com/try?tck=docs_navbar 2.安装过程一路下一步就行,选择complete安装,可以勾选安装Compass工具 ...
JUC并发—7.AQS源码分析三
大纲 1.等待多线程完成的CountDownLatch介绍 2.CountDownLatch.await()方法源码 3.CountDownLatch.coutDown()方法源码 4.CountDo ...

PaddleOCR学习笔记3-通用识别服务

PaddleOCR学习笔记3-通用识别服务的更多相关文章

随机推荐

热门专题