paddle训练安装

这里共有三个模块安装部署与训练。版面区域检测、文本检测、文本识别。

一、版面区域检测模块训练

	说明：训练这里只需要用到paddlepaddle、paddlex。所以ocr这里不安装。

以下为CPU安装方式运行，GPU请参考下面的链接。数据集需要自己下载或自己准备，采用COCO类型数据集。

1、下载paddlex项目后，进入该目录并创建虚拟环境3.10。

参考链接：[https://paddlepaddle.github.io/PaddleX/latest/installation/paddlepaddle_install.html#docker](https://paddlepaddle.github.io/PaddleX/latest/installation/paddlepaddle_install.html#docker)

2、先用用 pip 在当前环境中安装飞桨 PaddlePaddle。

	`python -m pip install paddlepaddle==3.0.0 -i https://www.paddlepaddle.org.cn/packages/stable/cpu/`

测试输出结果：

	`python -c "import paddle; print(paddle.__version__)"`

3、安装paddlex

	`pip install -e .`

4、安装插件，比如PaddleDetection、

	```

paddlex --install PaddleXXX # 例如PaddleOCR、PaddleDetection

paddlex --install #安装所有插件，不建议，中间出过多次错误。

	paddlex --install --platform gitee.com   # gitee源，安装所有插件。



	5、执行数据集验证：

		```

python main.py -c paddlex/configs/modules/layout_detection/PP-DocLayout-L.yaml -o Global.mode=check_dataset -o Global.dataset_dir=./study/train/dataset/det_layout_examples

		“Check dataset passed !”为验证成功

执行训练命令：

	```

python main.py -c paddlex/configs/modules/layout_detection/PP-DocLayout-L.yaml -o Global.mode=train -o Global.dataset_dir=./study/train/dataset/det_layout_examples



		会报错，因为这个`PP-DocLayout-L.yaml`配置文件默认是采用GPU运行的，所以配置文件需要修改。

		```

mode: train #原本为check_dataset

		device: cpu  # 关键修改：从gpu:0,1,2,3改为cpu

	log查看异常，并处理

		```

pip install numba==0.56.4

pip install scikit-learn



二、文本检测模块训练

	(一)、这里基于PaddleOCR的文件检测模块训练。

		这里需要安装OCR。参考链接：[https://paddlepaddle.github.io/PaddleOCR/main/version3.x/installation.html](https://paddlepaddle.github.io/PaddleOCR/main/version3.x/installation.html)

		1、安装OCR

			```

python -m pip install paddleocr

			git clone https://gitee.com/paddlepaddle/PaddleOCR.git

			# 切换分支

			git checkout release/3.0

			# 安装依赖

			python -m pip install -r requirements.txt

			中间报错，numpy切换版本：

			pip install numpy==1.26.4

	2、文本检测 命令测试demo：

		`paddleocr text_detection -i https://paddle-model-ecology.bj.bcebos.com/paddlex/imgs/demo_image/general_ocr_001.png`

	3、下载训练数据集与预训练模型

		```

https://paddle-model-ecology.bj.bcebos.com/paddlex/data/ocr_det_dataset_examples.tar

# 下载 PP-OCRv5_server_det 预训练模型

wget https://paddle-model-ecology.bj.bcebos.com/paddlex/official_pretrained_model/PP-OCRv5_server_det_pretrained.pdparams



		3.1、这里需要修改配置文件。`configs/det/PP-OCRv5/PP-OCRv5_server_det.yml`，CPU训练的里面几个参数可进行改动

			```

use_gpu: false #启用CPU

			epoch_num: &epoch_num 2 #训练轮次

			distributed: false # 禁用分布式

	3、解压后进行训练

		# 单卡训练，多卡训练参考官网

		```

python tools/train.py -c configs/det/PP-OCRv5/PP-OCRv5_server_det.yml -o Global.pretrained_model=./study/train/dataset/PP-OCRv5_server_det_pretrained.pdparams Train.dataset.data_dir=./study/train/dataset/ocr_det_dataset_examples Train.dataset.label_file_list='[./study/train/dataset/ocr_det_dataset_examples/train.txt]' Eval.dataset.data_dir=./ocr_det_dataset_examples Eval.dataset.label_file_list='[./study/train/dataset/ocr_det_dataset_examples/val.txt]'

# https://paddlepaddle.github.io/PaddleOCR/main/version3.x/module_usage/text_detection.html#_42



		4、训练完成后，命令进行验证。

			```

python tools/eval.py -c configs/det/PP-OCRv5/PP-OCRv5_server_det.yml -o Global.pretrained_model=./output/PP-OCRv5_server_det_pretrained.pdparams  Eval.dataset.data_dir=./study/train/dataset/ocr_det_dataset_examples Eval.dataset.label_file_list='[./study/train/dataset/ocr_det_dataset_examples/val.txt]'

(二)、这里是基于paddlex的文本检测模块的数据集验证、训练与评估、导出等方法。

	1、验证数据集

		```

python main.py -c paddlex/configs/modules/text_detection/PP-OCRv5_mobile_det.yaml -o Global.mode=check_dataset -o Global.dataset_dir=./study/train/dataset/ocr_det_dataset_examples



			能正常运行OK，不能看问题是否是报错【AttributeError: 'FigureCanvasAgg' object has no attribute 'tostring_rgb'】

			我这边报错，修改【PaddleX\paddlex\modules\text_detection\dataset_checker\dataset_src\analyse_dataset.py】这个代码后ok了，

			内容如下（屏蔽掉的为原代码）：

				```

# canvas.draw()

				# width, height = fig.get_size_inches() * fig.get_dpi()

				# bar_array = np.frombuffer(canvas.tostring_rgb(), dtype="uint8").reshape(

				#     int(height), int(width), 3

				# )

				canvas.draw()

				width, height = fig.get_size_inches() * fig.get_dpi()

				rgba_array = np.asarray(canvas.buffer_rgba(), dtype="uint8").reshape(int(height), int(width), 4)

				bar_array = cv2.cvtColor(rgba_array, cv2.COLOR_RGBA2BGR)

				```

			第二段代码：

	```

				# canvas.draw()

				# width, height = fig.get_size_inches() * fig.get_dpi()

				# pie_array = np.frombuffer(canvas.tostring_rgb(), dtype="uint8").reshape(

				#     int(height), int(width), 3

				# )

				canvas.draw()

				width, height = fig.get_size_inches() * fig.get_dpi()

				rgba_array = np.asarray(canvas.buffer_rgba(), dtype="uint8").reshape(int(height), int(width), 4)

				pie_array = cv2.cvtColor(rgba_array, cv2.COLOR_RGBA2BGR)

		2、训练

			`python main.py -c paddlex/configs/modules/text_detection/PP-OCRv5_mobile_det.yaml -o Global.mode=train -o Global.dataset_dir=./study/train/dataset/ocr_det_dataset_examples`

		3、评估

			`python main.py -c paddlex/configs/modules/text_detection/PP-OCRv5_mobile_det.yaml -o Global.mode=evaluate -o Global.dataset_dir=./study/train/dataset/ocr_det_dataset_examples`

		如果安装报错，说缺少目录，则新建这个目录

		`### D:\developSoft\anaconda3\envs\ocr310\Lib\site-packages\paddlex\repo_manager\repos`

		```

参考链接

https://paddlepaddle.github.io/PaddleOCR/latest/version3.x/pipeline_usage/PP-ChatOCRv4.html#1-pp-chatocrv4

https://paddlepaddle.github.io/PaddleOCR/latest/version3.x/module_usage/text_detection.html#43



三、文本识别模块训练

	(一)、PaddleOCR版文本识别模块的训练

		1、文本识别模块跟文本检测模式都是依赖于PaddleOCR，所以上面下载好PaddleOCR源码后，进入源码目录。

		自己下载好模型与数据集

		`https://paddlepaddle.github.io/PaddleOCR/main/version3.x/module_usage/text_recognition.html#411`

		2、修改配置文件`configs/rec/PP-OCRv5/PP-OCRv5_server_rec.yml`以下内容：

		 ```

 use_gpu: false

		  epoch_num: 2

		  character_dict_path: ./study/train/dataset/ocr_rec_dataset_examples/dict.txt

          ... ...

		  Train:

			dataset:

			   data_dir: ./study/train/dataset/ocr_rec_dataset_examples/

			   label_file_list:

				   - ./study/train/dataset/ocr_rec_dataset_examples/train.txt

		  Eval:

			dataset:

			   data_dir: ./study/train/dataset/ocr_rec_dataset_examples/

			   label_file_list:

				  - ./study/train/dataset/ocr_rec_dataset_examples/val.txt

	```		

		3、Python训练命令如下：

		`python tools/train.py -c configs/rec/PP-OCRv5/PP-OCRv5_server_rec.yml -o Global.pretrained_model=./study/train/dataset/PP-OCRv5_server_rec_pretrained.pdparams`

		4、模型评估：

		`python tools/eval.py -c configs/rec/PP-OCRv5/PP-OCRv5_server_rec.yml -o Global.pretrained_model=output/PP-OCRv5_server_rec/latest.pdparams`

		5、模型导出指令：

		`python tools/export_model.py -c configs/rec/PP-OCRv5/PP-OCRv5_server_rec.yml -o Global.pretrained_model=output/PP-OCRv5_server_rec/latest.pdparams Global.save_inference_dir=".out/tt/PP-OCRv5_server_rec_infer/"`

	(二)、PaddleX版文本识别模块的训练

		1、数据下载链接：

		2、数据集验证：

			`python main.py -c paddlex/configs/modules/text_recognition/PP-OCRv4_mobile_rec.yaml -o Global.mode=check_dataset -o Global.dataset_dir=./study/train/dataset/ocr_rec_dataset_examples`

			能正常运行OK，不能看问题是否是报错【AttributeError: 'FigureCanvasAgg' object has no attribute 'tostring_rgb'】

			我这边报错，修改【`PaddleX\paddlex\modules\text_recognition\dataset_checker\dataset_src\analyse_dataset.py`】这个代码后ok了，

			内容如下（屏蔽掉的为原代码）：

				```

# canvas.draw()

				# width, height = fig.get_size_inches() * fig.get_dpi()

				# pie_array = np.frombuffer(canvas.tostring_rgb(), dtype="uint8").reshape(

				#     int(height), int(width), 3

				# )

				canvas.draw()

				width, height = fig.get_size_inches() * fig.get_dpi()

				rgba_array = np.asarray(canvas.buffer_rgba(), dtype="uint8").reshape(int(height), int(width), 4)

				pie_array = cv2.cvtColor(rgba_array, cv2.COLOR_RGBA2BGR)

	3、训练指令：

		`python main.py -c paddlex/configs/modules/text_recognition/PP-OCRv4_mobile_rec.yaml -o Global.mode=train -o Global.dataset_dir=./study/train/dataset/ocr_rec_dataset_examples`

	4、训练完成后，评估模型：

		`python main.py -c paddlex/configs/modules/text_recognition/PP-OCRv4_mobile_rec.yaml -o Global.mode=evaluate -o Global.dataset_dir=./study/train/dataset/ocr_rec_dataset_examples`

	5、推理模型：

		`python main.py -c paddlex/configs/modules/text_recognition/PP-OCRv4_mobile_rec.yaml -o Global.mode=predict -o Predict.model_dir="./output/ocr_rec_dataset_examples/best_accuracy/inference" -o Predict.input="general_ocr_rec_001.png"`

paddle训练安装的更多相关文章

使用 paddle来进行文本生成
paddle 简单介绍 paddle 是百度在2016年9月份开源的深度学习框架. 就我最近体验的感受来说的它具有几大优点: 1. 本身内嵌了许多和实际业务非常贴近的模型比如个性化推荐,情感分析,词向 ...
服务化部署框架Paddle Serving
服务化部署框架Paddle Serving 概述常见的深度学习模型开发流程需要经过问题定义.数据准备.特征提取.建模.训练过程,以及最后一个环--将训练出来的模型部署应用到实际业务中.如图1所示,当 ...
Paddle Inference原生推理库
Paddle Inference原生推理库深度学习一般分为训练和推理两个部分,训练是神经网络"学习"的过程,主要关注如何搜索和求解模型参数,发现训练数据中的规律,生成模型.有了训 ...
Linux Ubuntu安装Nvidia多GPU通信库NCCL
0. 前言在使用Python版本的PaddleDetection进行一些实验时,想同时利用多个GPU提高效率,遇到了一点问题 You may need to install 'nccl2' from ...
零样本文本分类应用：基于UTC的医疗意图多分类，打通数据标注-模型训练-模型调优-预测部署全流程。
零样本文本分类应用:基于UTC的医疗意图多分类,打通数据标注-模型训练-模型调优-预测部署全流程. 1.通用文本分类技术UTC介绍本项目提供基于通用文本分类 UTC(Universal Text C ...
【深度学习系列】关于PaddlePaddle的一些避“坑”技巧
最近除了工作以外,业余在参加Paddle的AI比赛,在用Paddle训练的过程中遇到了一些问题,并找到了解决方法,跟大家分享一下: PaddlePaddle的Anaconda的兼容问题之前我是在服务 ...
paddlespeech asr 使用教程
目录安装 paddle框架安装软件源安装源码安装快速使用下载测试使用的音频非流式命令行接口(CLI) 非流式Server服务流式Server服务指令详解打印paddlespeech_ ...
Pytorch及Yolov5环境配置及踩坑
Pytorch及Yolov5环境配置及踩坑 1.何为Yolov5 yolo是计算机视觉方面用来进行目标检测的一个十分出名的开源框架,我搜不到官方的对此概括性的定义,但实际上也没什么必要,更重要的是会使 ...
ML平台_Paddle参考
PaddlePaddle源自于 2013 年百度深度学习实验室创建的 “Paddle”.当时的深度学习框架大多只支持单 GPU 运算,对于百度这样需要对大规模数据进行处理的机构,这显然远远不够,极大拖 ...
ROS-I工业机器人培训课程资料 2017-06-30
美国ROS工业联盟于2017年6月6日至8日在德克萨斯州圣安东尼奥市的SwRI举办了ROS工业开发人员培训班.12位与会者代表了一系列不同的组织,包括Bastian Solutions,EWI,Joh ...

随机推荐

关于TCP的握手与挥手
关于TCP的握手与挥手前言由于自己每次都是唱的比懂的好听,光知道唱"三次握手四次挥手",再往里细问SYN标志就只能阿巴阿巴阿巴,为了解决自己的知识储备问题,顺便继续深入了解TC ...
mysql8的sql_mode不起作用
如果sql_mode似乎没有起作用,可能是由以下几个原因造成的: 配置文件位置不正确:确保my.ini文件位于MySQL服务器实际读取配置的位置.对于Windows系统,这通常是MySQL安装目录下的 ...
c#实现正弦sin、反正弦arcsin，正切tan、反正切arctan：求角度值
1 #region 三角函数和反三角函数 2 3 using System; 4 using System.Collections.Generic; 5 using System.IO; 6 usin ...
BURP APP HTTPS抓包xposed+justtrustme工具篇
APP HTTPS抓包当APP是HTTPS时,则单纯的使用Burpsuite无法抓取数据包,原因是APP启用了SSL Pinning(又叫做"SSL证书绑定"). 1.下载夜神模 ...
python3安装xlutils模块
下载: https://www.cnpython.com/pypi/xlutils/dl-xlutils-2.0.0-py2.py3-none-any.whl#google_vignette 安装: ...
二、C语言基础知识
声明本文内容大多取自<高级语言程序设计一书>,为本人学习笔记记录,切勿用于商业用途. 第一节 C 语言发展和特点 C 语言是当今最流行的计算机语言之一,是一种结构化的高级语言. 一.C ...
领域驱动的事实与谬误一 DDD 与 MVC
本文有以下几个目的: 让新手少交智商税,少浪费时间看一些软文. 普及一个基本概念:了解一项观点的提出年代和最初初衷,才能更好地掌握其精粹. 我想指出市场上一些误人子弟的软文. 首先说明:文中所说的谬误 ...
WO Mic - 免费麦克风
WO Mic可以将您的手机变成电脑麦克风.您无需支付一分钱购买任何设备.如果您选择无线传输,它也是便携的.数百万用户已经安装并每天都在使用它进行通话.录音.语音遥控等活动. 三大组件协同工作以实现这一 ...
GUI development with Rust and GTK4 阅读笔记
简记这是我第二次从头开始阅读,有第一次的印象要容易不少. 如果只关心具体的做法,而不思考为什么这样做,以及整体的框架,阅读的过程将会举步维艰. 简略记录 gtk-rs 的书中提到的点.对同一个问题书 ...
codeup之奖金计算
codeup c2奖金计算 Description 某企业发放的奖金根据利润提成.利润I低于或等于100000时,奖金可提10%:利润高于100000元,低于200000元(100000<I&l ...

paddle训练安装

paddle训练安装的更多相关文章

随机推荐

热门专题