\(\text{EasyOCR}\) 支持超过 \(80\) 种语言的识别,包括英语、中文(简繁)、阿拉伯文、日文等,并且该库在不断更新中,未来会支持更多的语言。像市面上所有的图片识别都用的是 \(\text{OCR}\),如微信,百度。个人推荐软件:微信,网站https://web.baimiaoapp.com,该网站识别准确率是真的高,且收费也很人性化,使用后期仍然可以一天免费扫 \(5\) 张。

\(\text{OCR}\) 的扫描过程:

废话不多说,开始演示。

1.安装 \(\text{python}\)

由于 \(\text{python}\) 代码短,功能强大,所以编译器选择了 \(\text{python}\)。有 \(\text{python}\) 的忽略这一步,注意非 \(\text{python3.9}\) 可能会出现错误。

进入https://www.python.org/downloads/release/python-3913/,拉到最底下。

电脑 \(32\) 位的下上面这个,\(64\) 位的下下面这个。

双击打开,这里用了 \(3.7.4\) 的图,步骤一,最好两个都钩选,但必须勾选下面那个。

出现 \(setup\ was\ successful\),安装成功。

安装完后,\(win+r\),输入cmd,在 \(\text{cmd}\) 内输入 python,会弹出如下界面,如果您安装了 \(\text{python}\) 但在 \(\text{cmd}\) 内输入 python 没有如图文字,请重新安装。

2. 安装 \(\text{pip}\)

前置知识,\(\text{cmd}\) 命令:

cd 文件夹名 打开这个文件夹。

cd.. 返回上一层目录。

盘符名: 进入到某个盘,如进入到 \(F\) 盘为 F:

安装 \(\text{pip}\),在该题内下载附件pip-23.0.tar.gz 并解压,把路径复制下来。

然后进入到 \(\text{cmd}\)。

注意:你下载在什么盘,最好先输入 盘符:

进入 你下载的那个盘后,cd 刚才复制的内容,回车。再将 python setup.py install 复制下来,在 \(\text{cmd}\) 粘贴,回车。

然后就会开始安装,大约 \(5\) 秒钟。安装完后,输入 pip,若没有报错,即成功。

以下是安装完后,输入 pip,成功画面,若报错,请重新安装 \(\text{python}\)。

3.安装 \(\text{EasyOCR}\)

按 \(\text{cmd}\) 的方法,进入到 \(\text{python}\) 的 \(\text{Scripts}\) 文件夹,输入 pip install easyocr -i https://pypi.tuna.tsinghua.edu.cn/simple,出现进度条即开始安装,如图。

安装完成:

4.使用 \(\text{EasyOCR}\)

首先,把这张图片下载下来,重命名为 \(\text{test.png}\)。

放在你当前登录的用户的文件夹里。如:

打开 \(\text{cmd}\),输入 python

输入:

# 导入easyocr
import easyocr
# 创建reader对象
reader = easyocr.Reader(['ch_sim','en'])
# 读取图像
result = reader.readtext('test.png')
# 结果 result
for i in result:
word = i[1]
print(word)

print(word) 后面还有两个换行,但好像没出来,请自行添加。也可以在该题内下载 py.txt,代码同上。

\(\text{test.png}\) 是打开文件名,可以自行更改。

第一次使用会下载语言,'ch_sim','en',是中文和英文,如果要下载其他语言,按照该表更改:

这两个进度条就是下载语言,以后使用不在出现。



如果发现无法自动下载,可以进入网址https://www.jaided.ai/easyocr/modelhub/,直接下载,下载下来的压缩包不用解压,直接放在 \(\text{~/.EasyOCR/model/}\) 目录下。具体下载哪个语言包,代码中下载英文和中文,是 \(\text{ch\_sim}\),与 \(\text{en}\) 下载其他语言可根据上文表中的代号一栏更改。

识别结果:

准确率是不是很高啊。用 \(\text{EasyOCR}\) 做最简单的图片识别。

小白也行的:Easy OCR做一款免费的图片转文字的更多相关文章

  1. jqgrid 对编辑行填写的内容做格式验证

    有时,我们需要在基于jqgrid表格编辑行的单元格做规范验证.jqgrid提供有支持,通过设置字段的editrules属性来约束格式. 约束方式: 1.内置的约束参数 (required: true, ...

  2. 【css对齐】块内或者行内图片与文字居中对齐最靠谱的方式!

    块内或者行内图片与文字居中对齐最靠谱的方式! 做图片与文字在一行的按钮时候最常用到,总结了一个靠谱的方法,终于可以完美的对齐下面给个代码 首先是html: <p class="btnU ...

  3. 【转】【51CTO 网+】怎样做一款让用户来电的产品

    [51CTO 网+]怎样做一款让用户来电的产品 据相关调查显示,目前全球移动用户平均每人安装应用约95个,每天使用的应用约35个.可见面对众多的移动应用,用户拥有非常大的选择空间.如果由于交互设计欠佳 ...

  4. 个人开发者做一款Android App需要知道的事情

    个人开发者做一款Android App需要知道的事情 在大学时, 自己是学计算机专业的,而且还和老师一起做过一年半的项目. 有时候是不是有这样的想法,做一个自己的网站.但一直未付诸行动.2012年时, ...

  5. fir.im Weekly - 如果让你重新做一款APP

    设想下:如果让你重新做一款 APP ,你会用到哪些开发.设计等资源和工具? 本期的 Weekly 为大家分享了最近不错的 APP 开发资源,大部分是关于 iOS 开发. Android 开发.UI设计 ...

  6. 如何做一款自己的Android App

    转自:http://www.cnblogs.com/hubcarl/p/4030884.html 正在做App,后续补充: 概述:以我开发的一款编程学习的App[编程在线]为例讲讲如何做一款自己的An ...

  7. 为什么要做一款ERP软件——开源软件诞生7

    技术之外的探讨--第7篇 用日志记录“开源软件”的诞生 赤龙ERP开源地址: 点亮星标,感谢支持,与开发者交流 kzca2000 码云:https://gitee.com/redragon/redra ...

  8. 支持批量图片转文字的【OCR】文字识别工具,支持截图识别,速度快,准确度高,免费OCR,开源软件

    想必大家偶尔也有需要从图片中提取文字的需求,虽然现在手机上都自带了拍照识别功能,可是从电脑上的图片传到手机识别再将结果发回来实 在是有点麻烦,尤其当图片数量较多时,更是费时费力,使用网页版工具又要面临 ...

  9. 刚学会 C++ 的小白用这个开源框架,做个 RPC 服务要多久?

    本文适合有 C++ 基础的朋友 本文作者:HelloGitHub-Anthony HelloGitHub 推出的<讲解开源项目>系列,本期介绍基于 C++ 的 RPC 开源框架--rest ...

  10. PaddlePaddle:在 Serverless 架构上十几行代码实现 OCR 能力

    ​ 飞桨 (PaddlePaddle) 以百度多年的深度学习技术研究和业务应用为基础,是中国首个自主研发.功能完备. 开源开放的产业级深度学习平台,集深度学习核心训练和推理框架.基础模型库.端到端开发 ...

随机推荐

  1. 微信小程序云函数

    小程序开发云环境设置 注意事项 每一个云函数都是一个独立的 nodeJS 项目.所以每个云函数下都有 package.json 文件 错误 前端操作数据库 1 指引 2 新建集合 3 新增记录 4 查 ...

  2. 还原大师-遍历残缺字符串匹配md5杂凑值

    题目: 我们得到了一串神秘字符串:TASC?O3RJMV?WDJKX?ZM,问号部分是未知大写字母, 为了确定这个神秘字符串,我们通过了其他途径获得了这个字串的32位MD5码. 但是我们获得它的32位 ...

  3. nodejs集群

    nodejs集群 单个 Node.js 实例运行在单个线程中. 为了充分利用多核系统,有时需要启用一组 Node.js 进程去处理负载任务. 集群中的Master 现在让我们详细了解Master的职责 ...

  4. 《数组》--DAY1--二分查找

    分治算法--二分查找(返回下标) 1.定义:在有序列表中,每次查找范围折半 列表若存在重复元素,返回下标不唯一 优点:比较次数少,速度快,性能好:缺点:要求列表有序 注意区分while(left &l ...

  5. ElasticSearch学习文档

    中文文档:https://doc.codingdict.com/elasticsearch/ Elastic 官方网站:Free and Open Search: The Creators of El ...

  6. 鸿蒙动画与交互设计:ArkUI 3D变换与手势事件详解

    大家好,我是 V 哥. 在鸿蒙 NEXT 开发中,ArkUI 提供了丰富的 3D 变换和手势事件功能,可用于创建生动且交互性强的用户界面.下面详细介绍 ArkUI 的 3D 变换和手势事件,并给出相应 ...

  7. <HarmonyOS第一课10>ArkUI进阶#鸿蒙课程##鸿蒙生态#

    课程介绍 <HarmonyOS第一课:ArkUI进阶>是专为HarmonyOS开发者设计的课程,旨在提升开发者在ArkUI框架中的布局技能.课程将重点讲解如何进行布局性能优化,包括精简节点 ...

  8. 设计模式之“状态模式(State)”(未完整)

    一.状态模式(State) 状态模式是当一个对象的内在状态改变时允许改变其行为,这个对象看起来像是改变了其类 二.状态模式的作用 状态模式主要解决的是当控制一个对象状态转换条件表达式过于复杂时的情况. ...

  9. 掌握Node.js原理,开启异步编程之旅

    @charset "UTF-8"; .markdown-body { line-height: 1.75; font-weight: 400; font-size: 15px; o ...

  10. Node v18.6 发布的这个新特性未来可能改变前端工程化

    @charset "UTF-8"; .markdown-body { line-height: 1.75; font-weight: 400; font-size: 15px; o ...