安装 tesseract
brew install tesseract

加入环境变量
export TESSDATA_PREFIX=/usr/local/Cellar/tesseract/4.1.0/share/tessdata

查看安装位置
bogon:verify macname$ brew list tesseract
/usr/local/Cellar/tesseract/4.1.0/bin/tesseract
/usr/local/Cellar/tesseract/4.1.0/include/tesseract/ (19 files)
/usr/local/Cellar/tesseract/4.1.0/lib/libtesseract.4.dylib
/usr/local/Cellar/tesseract/4.1.0/lib/pkgconfig/tesseract.pc
/usr/local/Cellar/tesseract/4.1.0/lib/ (2 other files)
/usr/local/Cellar/tesseract/4.1.0/share/tessdata/ (22 files)
/usr/local/Cellar/tesseract/4.1.0/share/tessdata.bak/ (35 files)

pip3.7 install pytesseract

链接: https://pan.baidu.com/s/13Ywyn3GKziEjZG307zDFjQ 提取码: ptkc

下载后,用tessdata替换/usr/local/Cellar/tesseract/4.1.0/share/tessdata/

然后运行generate.py

bogon:verify macname$ python3 generate.py
. 甲 方 所 代 理 的 金 融 公 司 通
颊 差 , 甲 方 向 乙 方 又 付 客 广 交
( 备 泞 : 此 点 莪 口 因 平 台 点 荞
. 双 方 坝 御 月 门 前 确 认 上 欢 项 汇 到 乙 万 指 定 的 账 户 上 。

参考:

https://www.cnblogs.com/zhangxinqi/p/9297292.html#_label3
http://www.liangchan.net/soft/softdown.asp?softid=11126
https://www.bbsmax.com/A/GBJrZgQKJ0/
https://bbs.csdn.net/topics/392409466
https://github.com/tesseract-ocr/tesseract/wiki
https://blog.csdn.net/a745233700/article/details/80175883
https://www.cnblogs.com/chenyanbin/p/10398685.html
https://yq.aliyun.com/articles/330275
https://blog.csdn.net/weixin_33991418/article/details/90187385
https://www.cnblogs.com/xuchunlin/p/9415620.html

mac 使用tesseract识别图片中的中文的更多相关文章

  1. python tesseract 识别图片中的文字的乱码问题(ubuntu系统下)

    OCR(Optical Character Recognition):光学字符识别,是指对图片文件中的文字进行分析识别,获取的过程. 首先,需要安装 tesseract-ocr(tesseract O ...

  2. python基于万象优图识别图片中的中文

    最近一直在研究光学字符识别,即OCR.最开始在谷爹那里了解到了开源的Tesseract,可以拿来识别简单的英文和数字.但是识别中文的准确率并不高. 然后从Tesseract到Tesseract.js, ...

  3. python用Tesseract读取图片中的中文,出现乱码

    到http://download.csdn.net/detail/wanghui2008123/7621567下载中文简体包 然后找到tessdata目录,把eng.traineddata替换为chi ...

  4. python实战===用python识别图片中的中文

    需要安装的模块 PIL pytesseract 需要下载的工具: http://download.csdn.net/download/bo_mask/10196285 因为之前百度云的链接总失效,所以 ...

  5. Windows下 训练Tesseract实现识别图片中的文字

    介绍 Tesseract是一个基于Apache2.0协议开源的跨平台ocr引擎,支持多种语言的识别,在Windows和Linux上都有良好的支持. 源代码在这: 源码地址 有一个编译打包好的Windo ...

  6. 深入学习使用ocr算法识别图片中文字的方法

    公司有个需求,简单点说需要从一张图片中识别出中文,通过python来实现,当然其他程序也行,只要能实现,而小编主要学习python,所以就提了python.一个小白在网上遨游了一天,终于找到一丝丝思绪 ...

  7. 如何用ABBYY FineReader识别图片中的文本

    ABBYY FineReader 12是一款OCR光学字符识别软件,能够快速方便地将扫描纸质文档.PDF文件和数码相机的图像转换成可编辑.可搜索的文本,让电脑处理更具效率,摆脱从前的烦恼,告别耗时费力 ...

  8. Tesseract识别图片提取文字&字库训练

    文中测试了3.0和4.0两个版本.发现3.0识别效率不准确,需要训练词库.4.0识别效率就比较高了,而且支持结果生成pdf.txt等格式.所以推荐使用4.0版本. 这个工具可以用在爬虫的时候获取验证码 ...

  9. 吴裕雄--天生自然python学习笔记:python 用 Tesseract 识别验证码

    用 Selenium 包实现网页自动化操作的案例中,发现很多网页都因 需输入图形验证码而导致实验无法进行 . 解决的办法就是对验证码进行识别 . 识 别的方法之 一 是通过图形处理包将验证码的大部分背 ...

随机推荐

  1. intent 参数的规范

    对于采用 intent 参数的 Activity Manager 命令,您可以使用以下选项指定 intent: -a action 指定 intent 操作,如“android.intent.acti ...

  2. 03、新手必须掌握的Linux命令

    Ⅰ. 常用系统工作命令 1. echo 命令 echo命令用于在终端输出字符串货变量提取后的值,格式为"echo [字符串 | $变量]" 例:把指定字符串"LinxuH ...

  3. css之纯css实现流程导航效果

    :::tip 使用纯css线上 流程导航效果.     本文统一采取 flex 布局 ,你也可以采用其他布局实现,核心原理不变 ::: ## 方法一 利用裁剪  该方法IE下不支持 利用裁剪 clip ...

  4. Django:RestFramework之-------权限

    4.restframework-权限 4.1权限: 权限在单个视图应用. class MyPermission(object): """认证类""&q ...

  5. ssh工具推荐

    FinalShell 看图就知道功能多强大了, 官网地址 http://www.hostbuf.com

  6. Eclipse apk项目创建和项目构架

    一.创建项目工程 设定名字 设定包名(每一台机器只有唯一的包名)下一步 根据设置进行选择 创建空项目 Finish即可创建 调节项目的字体 二.Eclipse 项目构架 Src 2. Gen R.ja ...

  7. 响应式js库——rxjs

    原文地址:https://rxjs.dev/guide/overview 简介 RxJS 是组合异步以及基于事件的使用可观察者序列的程序类库.它提供一个核心类型,Observable,附属类型(Obs ...

  8. k8s 初识pod (二)

    kubernetes中调用pod到哪个节点上是无关紧要的,但由于实际情况,每台node的硬件环境不一致,所以某些情况要求将不同pod调到指定节点上运行.也可以通过label实现. kubectl la ...

  9. Spring Cloud 手记

    文档:https://www.springcloud.cc/spring-cloud-dalston.html#_features 一年了,我们都用 Spring Cloud 干了啥?:https:/ ...

  10. CentOS6.7编译php5安装错误大全

    在CentOS编译PHP5的时候有时会遇到以下的一些错误信息,基本上都可以通过yum安装相应的库来解决.以下是具体的一些解决办法: 复制代码 代码如下: checking for BZip2 supp ...