搭建自己的OCR服务，第三步：PPOCRLabel标注工具安装

PandaCode辉 2025-03-18 11:37:55 原文

一、安装说明

安装好了PaddleOCR后，还需要安装PPOCRLabel这个标注工具，想要自己训练模型的话，有个标注工具会起很大作用。

尤其是PPOCRLabel就是跟PaddleOCR配套的标注工具，同样是开源的。

在下载 PaddleOCR 整个源码中，就有PPOCRLabel安装程序和源代码。

不记得可以重新下载PaddleOCR 整个源码，地址如下：

git clone https://github.com/PaddlePaddle/PaddleOCR.git

二、PPOCRLabel简介

PPOCRLabel是一款适用于OCR领域的半自动化图形标注工具，内置PP-OCR模型对数据自动标注和重新识别。

使用Python3和PyQT5编写，支持矩形框标注、表格标注、不规则文本标注、关键信息标注模式，导出格式可直接用于PaddleOCR检测和识别模型的训练。

三、安装PPOCRLabel

1，pip 安装

pip install PPOCRLabel -i https://mirror.baidu.com/pypi/simple

2，下载源码

git clone https://github.com/PaddlePaddle/PaddleOCR.git

四、使用PPOCRLabel

cd ./git_workspace/PaddleOCR/PPOCRLabel

运行启动命令

1, 选择标签模式来启动 PPOCRLabel
PPOCRLabel --lang ch # 启动【普通模式】，用于打【检测+识别】场景的标签
PPOCRLabel --lang ch --kie True # 启动【KIE 模式】，用于打【检测+识别+关键字提取】场景的标签

2, 通过Python脚本运行 PPOCRLabel

进入PPOCRLabel源码目录

cd ./git_workspace/PaddleOCR/PPOCRLabel

运行启动命令，--lang ch 中文模式启动，不加参数则是英文界面和英文识别

python PPOCRLabel.py --lang ch

初次启动会自动下载安装检测+识别的模型

显示标注工具界面

3，选择需要标注的图片文件夹目录

4，进行标注

PPOCRLabel可以自动标注，在PPOCRLabel自动标注完成后再对标注错误的文字进行修改，点击已识别文字框或者新增“矩形标注”，

可在对应的识别结果区域进行修改。对图片完成标注后点击右下角确认按钮即可保存标注结果。

文件列表，图片名称左边都打了，绿色的才算完成标注。

5，导出标注结果

标注结果保存在样本目录下，文件名为Label.txt

最后，导出标注结果文件可直接用于PaddleOCR检测和识别模型的训练。

搭建自己的OCR服务，第三步：PPOCRLabel标注工具安装的更多相关文章

Mac系统下使用VirtualBox虚拟机安装win7－－第三步在虚拟机上安装 Windows 7
第三步在虚拟机上安装 Windows 7 等待虚拟机进入 Windows 7 的安装界面以后,在语言,货币,键盘输入法这一面,建议保持默认设置,直接点击“下一步”按钮,如图所示
Mosquitto搭建Android推送服务（三）Mosquitto集群搭建
文章钢要: 1.进行双服务器搭建 2.进行多服务器搭建一.Mosquitto的分布式集群部署如果需要做并发量很大的时候就需要考虑做集群处理,但是我在查找资料的时候发现并不多,所以整理了一下,搭建简 ...
Knative 实战：三步走！基于 Knative Serverless 技术实现一个短网址服务
短网址顾名思义就是使用比较短的网址代替很长的网址.维基百科上面的解释是这样的: 短网址又称网址缩短.缩短网址.URL 缩短等,指的是一种互联网上的技术与服务,此服务可以提供一个非常短小的 URL 以代 ...
nodejs anywhere 搭建本地静态文件服务
一.背景工作中有时候往往会遇到下述场景:例如需要将新打好的安装包等文件临时性的给到同事,可能还需要给到多个同事.这时,我们往往有如下几种方案: 1,一般都会有公司内部的文件系统,上传文件后将对应的地 ...
Centos搭建SVN服务器三步曲
搭建SVN服务,有效的管理代码,以下三步可以快速搞定.1.安装 #yum install subversion 判断是否安装成功#subversion -v svnserve, version 1.6 ...
使用AWS亚马逊云搭建Gmail转发服务（三）
title: 使用AWS亚马逊云搭建Gmail转发服务(三) author:青南 date: 2015-01-02 15:42:22 categories: [Python] tags: [log,G ...
vscode加MinGw三步搭建c/c++调试环境
vscode加MinGw三步搭建c/c++调试环境 step1:安装vscode.MinGw 1.1 vscod常规安装:https://code.visualstudio.com/ 1.2 MinG ...
Hexo + Serverless Framework，简单三步搭建你的个人博客
很多人都想拥有自己的个人博客,还得看起来漂亮.酷酷的.尤其对开发者来说,不仅可以分享技术(装)心得(逼),面试的时候还能成为加分.这里介绍两款好用的神器,不用忙前(前端)忙后(后端),简单3min即可 ...
go-zero docker-compose 搭建课件服务（三）：编写courseware api服务
0.转载 go-zero docker-compose 搭建课件服务(三):编写courseware api服务 0.1源码地址 https://github.com/liuyuede123/go-z ...
三步快速搭建Typora图床(SM.MS+PicGo)
三步快速搭建Typora图床(基于SM.MS+PicGo) 前言在有些同学使用Typora的过程中,会发现Typora不像Word一样,在文档脱离本机后依然正常显示图片,自己的tyopora文件在发 ...

随机推荐

Qt数据库应用15-通用数据库同步
一.前言数据库同步的主要功能是将本地的数据库记录同步到远程的数据库,其中数据库类型不限,比如本地是sqlite数据库,远程可以是mysql数据库,本地是mysql数据库,远程也可以是postgres ...
[转]CSS、LESS和SASS（SCSS）的区别以及Ruby Sass、LibSass、Node Sass、Dart Sass之间的关系
随着前端开发的不断发展,CSS也逐渐延伸出了很多新的语言,less和Sass就是其中两种,下面我们就一起来看看它们到底有何区别. SASS和LESS SASS(英文全称:Syntactically A ...
如何设计一个注册中心？以Zookeeper为例
这是小卷对分布式系统架构学习的第8篇文章,在写第2篇文章已经讲过服务发现了,现在就从组件工作原理入手,讲讲注册中心以下是面试题: 某团面试官:你来说说怎么设计一个注册中心? 我:注册中心嘛,就要有服 ...
Note -「M. Analysis 24 Aut. Prev.」“有歌的地方，自有向往”
\[\textit{Litar!} \newcommand{\opn}[1]{\operatorname{#1}} \newcommand{\card}[0]{\opn{card}} \newcomm ...
Mybatis插入数据后返回主键
添加记录后获取主键ID,这是一个很常见的需求,特别是在一次前端调用中需要插入多个表的场景. 除了添加单条记录时获取主键值,有时候可能需要获取批量添加记录时各记录的主键值,MyBatis从3.3.1版本 ...
Qml 中实现时间轴组件
[写在前面] 时间轴组件是现代用户界面中常见的元素,用于按时间顺序展示事件. 本文将介绍如何使用 Qml 实现一个灵活且可定制的时间轴组件,并探讨其设计思路和实现细节. [正文开始] 效果图组件概述 ...
Superset 用户集成方案
注意,一下内容来自外网浏览器翻译,本人使用了将superset集成进入第三方系统,superset采用自定义身份验证+第三系统iframe嵌入方式,但是这个方式存在一个问题,iframe与redire ...
Docker与联合文件系统
1. 联合文件系统概念 UnionFS(联合文件系统)是一种分层,轻量级并且高性能的文件系统,它支持对文件系统的修改作为一次次的提交来一层一层的叠加,同时可以将不同目录挂载到同一个虚拟文件系统下(u ...
Linux VXLAN小实验
本文分享自天翼云开发者社区<Linux VXLAN小实验>,作者:李****一前言 VXLAN在云网络中应用十分广泛.本文介绍一种方法在两台Linux主机之间建立简单的VXLAN隧道,以 ...
LangChain基础篇 (03)
LangChain 核心模块学习:Memory 大多数LLM应用都具有对话界面.对话的一个重要组成部分是能够引用先前在对话中介绍过的信息.至少,一个对话系统应该能够直接访问一些过去消息的窗口.更复杂的 ...