应群友要求，要做一个图片转文字的格式，因为有些人的简历中只有一张图片要提取他里面的文字就不好办了。

于是就有了下面这个小工具：

功能：选择要识别的图片后，识别出来后存到.txt文本中。

实现原理，基于百度“文字识别”通用版的api接口调用。

有一点需要说明的是可能无法识别百分百准确的，格式排版还是要人为去处理一下。

代码如下：

from aip import AipOcr

from PIL import Image as PImage

from PIL import ImageTk

from tkinter import *

from tkinter import filedialog

将图片内容翻译为文字，显示在文本框内

def trans():

# """ 你的 APPID AK SK """

APP_ID = ''

API_KEY = ''

SECRET_KEY = '*************'

client = AipOcr(APP_ID, API_KEY, SECRET_KEY)

contents.delete('1.0', END)

transTxt = client.basicGeneral(open(filePath.get(), 'rb').read())

# 对transTxt进行处理  去空格，换行符去重

transTxt=transTxt['words_result']

# transTxt=[{'words': '每个人总在仰望和'}, {'words': '羡慕着别人的幸福'}, {'words': '一回头'}, {'words': '却发现自己正被别'}, {'words': '人仰望和羡慕着'}]

words_content=''

for words in transTxt:

    values =words['words']

    words_content +=values+'\n'

print(words_content)

contents.insert(INSERT,words_content)

# 将文字保存到TXT文件

with open(filePath.get()+'_to_word.txt', 'w') as f:

    f.write(words_content)

打开图片文件，显示路径，并将图片展现

def openfile():

filename.delete('1.0', END)

filePath.set(filedialog.askopenfilename())

filename.insert(1.0, filePath.get())

org_img = PImage.open(filePath.get())

# 调整图片显示大小 600*800

w, h = org_img.size

if w > 600:

h = int(h * 600 / w)

w = 600

if h > 800:

w = int(w * 800 / h)

h = 800

img = ImageTk.PhotoImage(org_img.resize((w, h)))

showPic.config(image=img)

showPic.image = img # 保持一个引用才能显示图片，tkinter的BUG

设置主窗口

top = Tk()

top.title("图片转文字引擎：百度云API文字识别 Made by: Running")

top.iconbitmap("./pic/y1.ico")

top.geometry("800x600")

filePath = StringVar()

第一个窗体

frame1 = Frame(top, relief=RAISED, borderwidth=2)

frame1.pack(side=TOP, fill=BOTH, ipady=5, expand=0)

Label(frame1, height=1, text="图片路径：").pack(side=LEFT)

filename = Text(frame1, height=2)

filename.pack(side=LEFT, padx=1, pady=0, expand=True, fill=X)

Button(frame1, text="打开文件", image='', command=openfile).pack(side=LEFT, padx=5, pady=0)

Button(frame1, text="识别图片", image='', command=trans).pack(side=LEFT, padx=5, pady=0)

第二个窗体

frame2 = Frame(top, relief=RAISED, borderwidth=2)

frame2.pack(side=LEFT, fill=BOTH, expand=1)

Label(frame2, text='待识别的图片：', borderwidth=5).pack(side=TOP, padx=20, pady=5)

showPic = Label(frame2, text='图片显示区')

showPic.pack(side=BOTTOM, expand=1, fill=BOTH)

第三个窗体

frame3 = Frame(top)

frame3.pack(side=RIGHT, fill=BOTH, expand=1)

contents = ScrolledText(frame3)

Label(frame3, text='图片识别结果：', borderwidth=5).pack(side=TOP, padx=20, pady=10)

contents = Text(frame3, font=('Arial', 15))

contents.pack(side=TOP, expand=1, fill=BOTH)

Label(frame3, text='Copyright 2024 baidu.com ALL Rights Reserved', borderwidth=5).pack(side=BOTTOM, padx=20, pady=10)

top.mainloop()

python 图片转文字小工具的更多相关文章

InkImageDataSetGenerator-开源一个可用于机器学习的书写轨迹图片生成的小工具
这是一个简单易用的图片数据集生成小工具,基于OpenCV和UWP Ink API,它可以根据指定的手写轨迹生成一系列各个角度的图片.每张图片的尺寸和总体数量都是可以指定的,均存放在统一的生成目录中.h ...
python开发目录合并小工具 PathMerge
前言这个程序陆陆续续开发了几天,正好我在学Python,就一边做一边学,倒是学到不少东西. 不得不说python是快速开发的好工具. 程序做了一些改进,这两天又忙着毕设,现在才想起来发到博客上.想想 ...
python 3.6 MJ小工具
2017.07.14 update 做了个界面,不需要使用cmd命令行+文件路径的方式来使用了: 链接如下: http://www.cnblogs.com/chenyuebai/p/7150382.h ...
语音转文字小工具开发Python
# -*- coding: utf- -*- import requests import re import os import time from aip import AipSpeech fro ...
目不识丁的我使用Python编写汉字注音小工具
一万点暴击伤害人懒起来太可怕了,放了个十一充分激发了我的惰性.然后公众号就这么停了半个月,好惭愧- 新学期儿子的幼儿园上线了APP,每天作业通过app布置后,家长需要陪着孩子学习,并上传视频才算完成 ...
python转exe的小工具
其实只是在cxfreeze的基础上加了个壳,做成窗口软件了使用了pyqt做的界面,软件发布在了开源中国上,可以直接去下面的地址查看 http://git.oschina.net/robocky/py ...
python之字符聊天小工具
server side: # coding: gb2312#socket server端#获取socket构造及常量from socket import *#''代表服务器为localhostmyHo ...
入坑python 自己写的小工具，纪念一下
这个程序的功能是可以从表格中读取某一列数据,传到IDs 这一个参数里,然后在url中获取相应的请求值,并打印 import urllib.request import json import xlrd ...
python一些实用的小工具
1 搭一个简易的本地局域网 python -m http.server 2 获取当前目录下的所有文件名 3 进度条效果 import sys,time for i in range(50): sy ...

随机推荐

从 vs 的 rc 文件中获取版本号
更新项目版本号时,需要与 rc 文件的 version 同步,比较方便的方法是直接从 rc 文件中获取版本号,并应用到程序中 // 删除日志检查 bool GetVersion() { // get ...
Redis服务端事件处理流程分析
一.事件处理 1.1 什么是事件 Redis 为什么运行得比较快? 原因之一就是它的服务端处理程序用了事件驱动的处理方式. 那什么叫事件处理?就是把处理程序当成一个一个的事件处理.比如我前面文章:服务 ...
FART 脱壳机原理分析
FART是一个基于Android 源码修改的脱壳机可以脱整体壳和抽取壳 FART脱壳的步骤主要分为三步: 1.内存中DexFile结构体完整dex的dump 2.主动调用类中的每一个方法,并实现对应 ...
day05---系统的重要文件(2)
回顾 /etc/sysconfig/network-scripts/ifcfg-eth0 网卡配置文件 TYPE=Ethernet BOOTPROTO=none NAME=eth0 DEVICE=et ...
sql判断字符串中含中文方法
基于UTF-8字符集它是一种多字节字符集,编码为变长编码.那么它的编码范围根据:http://www.iteye.com/topic/977671 作者提供的资料学习,整理出它编码范围如下: u2e ...
【LeetCode双指针】合并两个有序数组，从后向前遍历
合并两个有序数组 https://leetcode.cn/problems/merge-sorted-array/ 给你两个按非递减顺序排列的整数数组 nums1 和 nums2,另有两个整数 m ...
【Azure 事件中心】如何查看事件中心的消息中具体报文内容呢？
问题描述如何查看事件中心的消息中具体报文内容呢? 问题解答正常情况是通过 Event Hub 的消费端获取消息进行处理查看,但是没有客户端代码的情况下,也可以通过微软的默认客户端Service B ...
BUUCTF—Crypto（完结版本—_—）
BUUCTF-Crypto 1.一眼就解密考点:base64 我的解答: 字符串后面的等号,看来是base大家族,由字母和数字范围来看是base64,不管了,先扔CyberCher,仙女魔法棒变出f ...
1、eureka的注册流程
客户端注册到服务端是通过http请求的涉及到多级缓存 register注册表源码精髓:多级缓存设计思想在拉取注册表的时候: 首先从ReadOnlyCacheMap里查缓存的注册表. 若没有,就找 ...
搭建一个Java项目可直接拿去使用的通用工具类
1.通用枚举类 import lombok.Getter; /** * @Description 状态码定义约束,共6位数,前三位代表服务,后3位代表接口 * 比如商品服务210,购物车是220.用 ...

python 图片转文字小工具