一、各种部署方式特点及注意事项

简称

hubserving=PaddleHub Serving
pdserving=PaddleHub Serving
hub install =指通过paddlehub库直接安装部署服务

部署方式

都是基于Docker进行部署，Docker环境搭建参照该博文
如果你对Docker比较熟悉，可以直接拉取该项目，对应的方式及版本都做了归类

git pull https://github.com/steinvenic/PaddleOCR-Docker.git

如果被墙可以使用镜像站git pull https://github.com.cnpmjs.org/steinvenic/PaddleOCR-Docker.git

各服务特点

pdserving更适合企业级部署，性能更高，摘取官方的介绍:

支持客户端和服务端之间高并发和高效通信

支持工业级的服务能力例如模型管理，在线加载，在线A/B测试等

支持多种编程语言开发客户端，例如C++, Python和Java

hubserving可以理解为源码方式安装某个服务，配置型强
hub install 其实和hubserving方式一样，都使用paddlehub库进行部署的，其首次进行识别的的时候，会自动下载模型文件，真正一条命令就可以运行起来一个服务，部署起来超简单。

不足之处在于我现在还没找到对于相关模块的配置。只有paddlehub自己的一些启动参数可配置。如果你的显卡比较好，又想快点部署，优先考虑采用本方式。低端显卡要是使用此种方式，会导致显存迅速拉满，然后不可用，我现在也没找到解决办法。

相同配置的硬件，使用该种方式，CPU版相较于hubserving明显速度变慢很多，估计是某些参数没设置好，请酌情使用，GPU版本未测试

除了本文的OCR，还有很多有趣的服务通过此种方式可快速搭建，详见

注意事项

相同价格的硬件，识别速度上还是GPU速度更快，优先选择GPU
部署方式上优先选择pdserving方式
如果你没有显卡，只能用CPU的话，一定要确认你的CPU要支持AVX指令集，验证方法:lscpu | grep avx

没有AVX指令的话，部署起来比较困难，而且识别速度应该会很慢。

如果你真想部署的话，要安装对应的noavx版本的paddlepaddle，whl包在这并且只能使用Python3.8,这个我暂时没时间验证是否能安装成功。等后面有时间了再研究一下...
当你使用wget获取资源的时候，如果发现速度很慢，只有几十KB,你可以尝试一下Ctrl+C取消后再重新获取，这个问题是什么导致的我也不清楚
如果你使用的是阿里云或者其他（非百度）的云平台获取资源的时候，速度奇慢，我想是被百度限制了，这时候你可能需要在本地下载好再传到你机器上，当然你也可以使用代理的方式
当你真想部署成一个可靠的服务时，GPU显存我感觉最少要16 GB
当你在阿里云上使用pdserving方式部署，有可能遇到显存被瞬间填满，机器卡死的情况。我本以为是PaddleServing造成的现存泄露，我也一直在纠结这个问题。但在百度的aistudio上，同样16G显存，aistudio是正常的

二、pdserving方式部署

GPU

`Dockerfile`:

FROM paddlepaddle/paddle:2.1.0-gpu-cuda10.2-cudnn7

LABEL maintainer="steinven@qq.com"

LABEL version="1.0"

LABEL description="PaddleOCR pdserving GPU version"

#github网速太慢或被墙，现用的cnpmjs加速，也可以更换为码云

ENV REPO_LINK=https://github.com.cnpmjs.org/PaddlePaddle/PaddleOCR.git

#模型数据

ENV	orc_detect_model=https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_det_infer.tar

ENV	orc_recognition_model=https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_rec_infer.tar

#whl包，开发测试阶段，未上传到pypi

ENV paddle_serving_client_test=https://paddle-serving.bj.bcebos.com/test-dev/whl/paddle_serving_client-0.0.0-cp37-none-any.whl

#安装所需的库文件

RUN pip3.7 install --upgrade pip paddle-serving-server-gpu==0.6.1.post101 paddle-serving-app==0.6.1 -i https://mirror.baidu.com/pypi/simple \

	&& git clone $REPO_LINK /PaddleOCR \

	&& pip3.7 install -r /PaddleOCR/requirements.txt -i https://mirror.baidu.com/pypi/simple

#下载模型数据并解压

WORKDIR /PaddleOCR/deploy/pdserving

ADD $orc_detect_model .

ADD $orc_recognition_model .

ADD $paddle_serving_client_test .

RUN for f in *.tar; do tar xf "$f"; done;rm -fr *.tar \

	&& pip3.7 install paddle_serving_client-0.0.0-cp37-none-any.whl \

	&& python3.7 -m paddle_serving_client.convert --dirname ./ch_ppocr_mobile_v2.0_det_infer/ \

                                         --model_filename inference.pdmodel          \

                                         --params_filename inference.pdiparams       \

                                         --serving_server ./ppocr_det_mobile_2.0_serving/ \

                                         --serving_client ./ppocr_det_mobile_2.0_client/ \

    && python3.7 -m paddle_serving_client.convert --dirname ./ch_ppocr_mobile_v2.0_rec_infer/ \

                                         --model_filename inference.pdmodel          \

                                         --params_filename inference.pdiparams       \

                                         --serving_server ./ppocr_rec_mobile_2.0_serving/  \

                                         --serving_client ./ppocr_rec_mobile_2.0_client/ \

	&& rm -fr *.tar

EXPOSE 9998

ENTRYPOINT ["/bin/bash","-c","python3.7 web_service.py"]

构建镜像

docker build -t pdserving_gpu:v1 .

运行

docker run -itd --network=host --gpus all --name pdserving_gpu pdserving_gpu:v1

修改配置

查看运行日志发现没有错误后，低端显卡的话，别先进行测试。我们需要修改一下配置文件。

默认的配置对显卡要求较高，需要修改一下QPS,默认的两个并发参数分别为8、4，现在拿我的GeForce 750 2GB显存，我需要把它改成2、1

进入容器：docker exec -it pdserving_gpu /bin/bash
打开配置文件vim /PaddleOCR/deploy/pdserving/config.yml,找到下图对应的两个参数，进行修改
重启docker容器:docker restart pdserving_gpu
测试：

# coding:utf-8

import base64

import json

import os

import requests

def cv2_to_base64(image):

    return base64.b64encode(image).decode('utf8')

url = "http://172.16.71.33:9998/ocr/prediction"

test_img_dir = r"C:\Users\eric\Desktop\pre_ocr_images"

for idx, img_file in enumerate(os.listdir(test_img_dir)):

    with open(os.path.join(test_img_dir, img_file), 'rb') as file:

        image_data1 = file.read()

    image = cv2_to_base64(image_data1)

    for i in range(1):

        data = {"key": ["image"], "value": [image]}

        r = requests.post(url=url, data=json.dumps(data))

        print(r.json())

print("==> total number of test imgs: ", len(os.listdir(test_img_dir)))

CPU

`Dockerfile`:

FROM paddlepaddle/paddle:2.1.0

LABEL maintainer="steinven@qq.com"

LABEL version="1.0"

LABEL description="PaddleOCR pdserving CPU version"

#github网速太慢或被墙，现用的cnpmjs加速，也可以更换为码云

ENV REPO_LINK=https://github.com.cnpmjs.org/PaddlePaddle/PaddleOCR.git

#模型数据

ENV	orc_detect_model=https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_det_infer.tar

ENV	orc_recognition_model=https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_rec_infer.tar

#whl包，开发测试阶段，未上传到pypi

ENV paddle_serving_client_test=https://paddle-serving.bj.bcebos.com/test-dev/whl/paddle_serving_client-0.0.0-cp37-none-any.whl

#安装所需的库文件

RUN pip3.7 install --upgrade pip paddle-serving-server==0.6.1 paddle-serving-app==0.6.1 -i https://mirror.baidu.com/pypi/simple \

	&& git clone $REPO_LINK /PaddleOCR \

	&& pip3.7 install -r /PaddleOCR/requirements.txt -i https://mirror.baidu.com/pypi/simple

#下载模型数据并解压

WORKDIR /PaddleOCR/deploy/pdserving

ADD $orc_detect_model .

ADD $orc_recognition_model .

ADD $paddle_serving_client_test .

RUN for f in *.tar; do tar xf "$f"; done;rm -fr *.tar \

	&& pip3.7 install paddle_serving_client-0.0.0-cp37-none-any.whl \

	&& python3.7 -m paddle_serving_client.convert --dirname ./ch_ppocr_mobile_v2.0_det_infer/ \

                                         --model_filename inference.pdmodel          \

                                         --params_filename inference.pdiparams       \

                                         --serving_server ./ppocr_det_mobile_2.0_serving/ \

                                         --serving_client ./ppocr_det_mobile_2.0_client/ \

    && python3.7 -m paddle_serving_client.convert --dirname ./ch_ppocr_mobile_v2.0_rec_infer/ \

                                         --model_filename inference.pdmodel          \

                                         --params_filename inference.pdiparams       \

                                         --serving_server ./ppocr_rec_mobile_2.0_serving/  \

                                         --serving_client ./ppocr_rec_mobile_2.0_client/ \

	&& rm -fr *.tar

EXPOSE 9998

ENTRYPOINT ["/bin/bash","-c","python3.7 web_service.py"]

构建镜像

docker build -t pdserving_cpu:v1 .

运行

docker run -itd --network=host --name pdserving_cpu pdserving_cpu:v1

后续测试请参见上方的GPU版本，不再赘述

三、hubserving方式部署

GPU版

`Dockerfile`：

FROM paddlepaddle/paddle:2.1.0-gpu-cuda10.2-cudnn7

LABEL maintainer="steinven@qq.com"

LABEL version="1.0"

LABEL description="PaddleOCR hubserving GPU version"

#github网速太慢或被墙，现用的cnpmjs加速，也可以更换为码云

ENV REPO_LINK=https://github.com.cnpmjs.org/PaddlePaddle/PaddleOCR.git

#模型数据，现用的ch_ppocr_mobile_v2.0_xx，为中英文超轻量OCR模型，因为源码参数中配置的就为该模型，

#所以不用修改源码。如果切换为服务端模型，记得修改deploy/hubserving/ocr_system/params.py下对应的模型位置

ENV	orc_detect_model=https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_det_infer.tar

ENV	orc_direction_model=https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_cls_infer.tar

ENV	orc_recognition_model=https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_rec_infer.tar

#安装所需的库文件

RUN pip3.7 install --upgrade pip paddlehub -i https://mirror.baidu.com/pypi/simple \

	&& git clone $REPO_LINK /PaddleOCR \

	&& pip3.7 install -r /PaddleOCR/requirements.txt -i https://mirror.baidu.com/pypi/simple \

	&& mkdir -p /PaddleOCR/inference	

#下载模型数据并解压

WORKDIR /PaddleOCR/inference/

ADD $orc_detect_model .

ADD $orc_direction_model .

ADD $orc_recognition_model .

RUN for f in *.tar; do tar xf "$f"; done;rm -fr *.tar

WORKDIR /PaddleOCR

EXPOSE 8868

ENTRYPOINT ["/bin/bash","-c","export CUDA_VISIBLE_DEVICES=0 && hub install deploy/hubserving/ocr_system/ && hub serving start -c deploy/hubserving/ocr_system/config.json "]

构建`docker`镜像

docker build -t hubserving_gpu:v1 .

运行

docker run -itd --network=host --gpus all --name hubserving_gpu hubserving_gpu:v1

检查运行状态，查看是否有错误,查看端口号

docker logs -f hubserving_gpu

客户端测试：

# coding:utf-8

import base64

import json

import os

import traceback

import cv2

import requests

test_img_dir = './imgs/1'

def cv2_to_base64(image):

    data = cv2.imencode('.jpg', image)[1]

    return base64.b64encode(data.tostring()).decode('utf8')

for idx, img_file in enumerate(os.listdir(test_img_dir)):

    try:

        data = {'images': [cv2_to_base64(cv2.imread(os.path.join(test_img_dir, img_file)))]}

        headers = {"Content-type": "application/json"}

        url = "http://172.16.71.33:8868/predict/ocr_system"

        r = requests.post(url=url, headers=headers, data=json.dumps(data))

        print(r.text)

        print(r.json()["results"])

    except:

        traceback.print_exc()

        continue

CPU版

`Dockerfile`

FROM paddlepaddle/paddle:2.1.0

LABEL maintainer="steinven@qq.com"

LABEL version="1.0"

LABEL description="PaddleOCR hubserving CPU version"

#github网速太慢或被墙，现用的cnpmjs加速，也可以更换为码云

ENV REPO_LINK=https://github.com.cnpmjs.org/PaddlePaddle/PaddleOCR.git

#模型数据，现用的ch_ppocr_mobile_v2.0_xx，为中英文超轻量OCR模型，因为源码参数中配置的就为该模型，

#所以不用修改源码。如果切换为服务端模型，记得修改deploy/hubserving/ocr_system/params.py下对应的模型位置

ENV	orc_detect_model=https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_det_infer.tar

ENV	orc_direction_model=https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_cls_infer.tar

ENV	orc_recognition_model=https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_rec_infer.tar

#安装所需的库文件

RUN pip3.7 install --upgrade pip paddlehub -i https://mirror.baidu.com/pypi/simple \

	&& git clone $REPO_LINK /PaddleOCR \

	&& pip3.7 install -r /PaddleOCR/requirements.txt -i https://mirror.baidu.com/pypi/simple \

	&& mkdir -p /PaddleOCR/inference	

#下载模型数据并解压

WORKDIR /PaddleOCR/inference/

ADD $orc_detect_model .

ADD $orc_direction_model .

ADD $orc_recognition_model .

RUN for f in *.tar; do tar xf "$f"; done;rm -fr *.tar

WORKDIR /PaddleOCR

EXPOSE 8868

ENTRYPOINT ["/bin/bash","-c","hub install deploy/hubserving/ocr_system/ && hub serving start -m ocr_system -p 8868"]

构建镜像

docker build -t hubserving_cpu:v1 .

运行

docker run -itd --network=host --name hubserving_cpu hubserving_cpu:v1

后续测试请参见上方的GPU版本，不再赘述

四、hub install方式部署

`GPU`版

`Dockerfile`

FROM paddlepaddle/paddle:2.1.0-gpu-cuda10.2-cudnn7

LABEL maintainer="steinven@qq.com"

LABEL version="1.0"

LABEL description="hub install GPU version"

ENV CUDA_VISIBLE_DEVICES=0

#安装所需的库文件

RUN pip3.7 install --upgrade pip paddlehub shapely pyclipper -i https://mirror.baidu.com/pypi/simple

ENTRYPOINT ["/bin/bash","-c","hub serving start -m chinese_ocr_db_crnn_server"]

构建镜像

docker build -t hub_install_gpu:v1 .

运行

docker run -itd --network=host --gpus all --name hub_install_gpu hub_install_gpu:v1

测试

# coding:utf-8

import base64

import json

import os

import cv2

import requests

def cv2_to_base64(image):

    data = cv2.imencode('.jpg', image)[1]

    return base64.b64encode(data.tostring()).decode('utf8')

url = "http://172.16.71.33:8866/predict/chinese_ocr_db_crnn_server"

test_img_dir = './images1'

for idx, img_file in enumerate(os.listdir(test_img_dir)):

    data = {'images': [cv2_to_base64(cv2.imread(os.path.join(test_img_dir, img_file)))]}

    headers = {"Content-type": "application/json"}

    r = requests.post(url=url, headers=headers, data=json.dumps(data))

    print(r.json()["results"])

`CPU`版

`Dockerfile`

FROM paddlepaddle/paddle:2.1.0

LABEL maintainer="steinven@qq.com"

LABEL version="1.0"

LABEL description="hub install CPU version"

#安装所需的库文件

RUN pip3.7 install --upgrade pip paddlehub shapely pyclipper -i https://mirror.baidu.com/pypi/simple

ENTRYPOINT ["/bin/bash","-c","hub serving start -m chinese_ocr_db_crnn_server"]

构建镜像

docker build -t hub_install_cpu:v1 .

运行

docker run -itd --network=host --name hub_install_cpu hub_install_cpu:v1

后续测试请参见上方的GPU版本，不再赘述

PaddleOCR系列（二）--hubserving & pdserving & hub install的更多相关文章

ANDROID Porting系列二、配置一个新产品
ANDROID Porting系列二.配置一个新产品详细说明下面的步骤描述了如何配置新的移动设备和产品的makefile运行android. 1. 目录//vendor/创建一个公 ...
ldap配置系列二：jenkins集成ldap
ldap配置系列二:jenkins集成ldap jenkins简介 jenkins是一个独立的.开放源码的自动化服务器,它可以用于自动化与构建.测试.交付或部署软件相关的各种任务. jenkins官方 ...
搜索引擎ElasticSearchV5.4.2系列二之ElasticSearchV5.4.2+kibanaV5.4.2+x-packV5.4.2安装
相关博文: 搜索引擎ElasticSearchV5.4.2系列一之ES介绍搜索引擎ElasticSearchV5.4.2系列二之ElasticSearchV5.4.2+klanaV5.4.2+x-p ...
Redis总结（五）缓存雪崩和缓存穿透等问题 Web API系列(三)统一异常处理 C#总结（一）AutoResetEvent的使用介绍（用AutoResetEvent实现同步） C#总结（二）事件Event 介绍总结 C#总结（三）DataGridView增加全选列 Web API系列(二)接口安全和参数校验 RabbitMQ学习系列（六）: RabbitMQ 高可用集群
Redis总结(五)缓存雪崩和缓存穿透等问题前面讲过一些redis 缓存的使用和数据持久化.感兴趣的朋友可以看看之前的文章,http://www.cnblogs.com/zhangweizhon ...
SonarQube系列二、分析dotnet core/C#代码
[前言] 本系列主要讲述sonarqube的安装部署以及如何集成jenkins自动化分析.netcore项目.目录如下: SonarQube系列一.Linux安装与部署 SonarQube系列二.分析 ...
Grafana +Zabbix 系列二
Grafana +Zabbix 系列二 Grafana 简介补充 Grafana自身并不存储数据,数据从其他地方获取.需要配置数据源 Grafana支持从Zabbix中获取数据 Grafana优化图形 ...
前端构建大法 Gulp 系列 (二)：为什么选择gulp
系列目录前端构建大法 Gulp 系列 (一):为什么需要前端构建前端构建大法 Gulp 系列 (二):为什么选择gulp 前端构建大法 Gulp 系列 (三):gulp的4个API 让你成为gul ...
WPF入门教程系列二十三——DataGrid示例(三)
DataGrid的选择模式默认情况下,DataGrid 的选择模式为“全行选择”,并且可以同时选择多行(如下图所示),我们可以通过SelectionMode 和SelectionUnit 属性来修改 ...
Web 开发人员和设计师必读文章推荐【系列二十九】
<Web 前端开发精华文章推荐>2014年第8期(总第29期)和大家见面了.梦想天空博客关注前端开发技术,分享各类能够提升网站用户体验的优秀 jQuery 插件,展示前沿的 HTML5 ...

随机推荐

【面试普通人VS高手系列】Spring Boot中自动装配机制的原理
最近一个粉丝说,他面试了4个公司,有三个公司问他:"Spring Boot 中自动装配机制的原理" 他回答了,感觉没回答错误,但是怎么就没给offer呢? 对于这个问题,看看普通人 ...
python 本地配置文件库 Dynaconf 简介
[前言] 在项目中经常会遇到以下几种需要用到配置文件的场景: 相同的配置参数用在不同的代码中,如果需要调整,则需要手动将各个使用到的地方都相应调整. 密码等信息不想硬编码在项目文件中. 配置文件的格式 ...
Linux-编译安装http-实验
准备工作 1.关闭防火墙和SELinux 2.基础安装的系统,安装以下命令 yum install gcc make autoconf gcc-c++ glibc glibc-devel pcre p ...
go convert slice to struct
Question: in golang how to convert slice to struct scene 1:use reflect convert slice to struct func ...
RabbitMQ 3.9( 基础 )
1.认识MQ 1.1.什么是MQ? MQ全称:message queue 即消息队列这个队列遵循的原则:FIFO 即先进先出队列里面存的就是message 1.2.为什么要用MQ? 1.2.1 ...
Focal and Global Knowledge Distillation for Detectors
一. 概述论文地址:链接代码地址:链接论文简介: 此篇论文是在CGNet上增加部分限制loss而来核心部分是将gt框变为mask进行蒸馏注释:仅为阅读论文和代码,未进行试验,如有漏错请不吝指 ...
用NetworkX生成并绘制（带权）无向图
NetworkX是一个非常强大的网络科学工具,它封装了图的数据结构和许多经典图算法,也内置了许多可视化函数可供调用. 1. 随机图生成最经典的随机图当属我们在上一篇博客<Erdos-Renyi ...
Swift初探03 字符串操作
字符串操作 01 获取长度 var a = "he l lo" print(a.count) // 计算空格,输出7 02 String.Index类型 String.Index类 ...
Golang：手撸一个支持六种级别的日志库
Golang标准日志库提供的日志输出方法有Print.Fatal.Panic等,没有常见的Debug.Info.Error等日志级别,用起来不太顺手.这篇文章就来手撸一个自己的日志库,可以记录不同级别 ...
手写vue路由
目录一.简易demo 二.Vue-Router传参方式三.进阶-路由导航一.简易demo // routes注册 import Vue from "vue"; // impo ...

PaddleOCR系列（二）--hubserving & pdserving & hub install

一、各种部署方式特点及注意事项

简称

部署方式

各服务特点

注意事项

二、pdserving方式部署

GPU

Dockerfile:

构建镜像

运行

修改配置

CPU

Dockerfile:

构建镜像

运行

三、hubserving方式部署

GPU版

Dockerfile：

构建docker镜像

运行

检查运行状态，查看是否有错误,查看端口号

客户端测试：

CPU版

Dockerfile

构建镜像

运行

四、hub install方式部署

GPU版

Dockerfile

构建镜像

运行

测试

CPU版

Dockerfile

构建镜像

运行

PaddleOCR系列（二）--hubserving & pdserving & hub install的更多相关文章

随机推荐

热门专题

`Dockerfile`:

`Dockerfile`:

`Dockerfile`：

构建`docker`镜像

`Dockerfile`

`GPU`版

`Dockerfile`

`CPU`版

`Dockerfile`