客户需求,识别一些证件内容,包括身份证、户口本、营业执照、银行卡以及房产证,前四个比较容易实现,不管是艺赛旗的 RPA 还是百度的 OCR 都有接口,直接调用即可,但是都没有房产证的 OCR 识别,只能自己使用其他 OCR 接口来进行相关操作了。
  房产证如下图所示:
  

  如果使用通用文字识别所有的文字都可以识别出来,但是顺序是乱的,所以我选择了使用通用文字识别(高精度含位置版),这样的话,我不仅可以识别到文字,还能知道文字所在的位置,然后根据文字位置进行区域划分,划分后的效果如下:

  

  代码如下:
  import base64
  import copy
  import re
  import requests
  class OCR(object):
  # client_id 为官网获取的AK, client_secret 为官网获取的SK
  client_id = ""
  client_secret = ""
  def get_token(self):
  """获取 access_token"""
  host = 'https://aip.baidubce.com/oauth/2.0/token'
  # 请求头
  headers = {'Content-Type': 'application/json; charset=UTF-8'}
  # 请求参数
  params = {
  "grant_type": "client_credentials",
  "client_id": self.client_id,
  "client_secret": self.client_secret
  }
  # get 请求
  response = requests.get(host, headers=headers, params=params)
  # 获取 json 内容
  content = response.json()
  # 获取 access_token
  access_token = content["access_token"]
  return access_token
  def encode_img(self, img_path):
  """对图片进行编码"""
  with open(img_path, "rb") as f:
  img_content = f.read()
  # 对图片进行 base64 编码
  img_content = base64.b64encode(img_content)
  return img_content
  def img_to_str(self, img_path):
  """对图片文字进行识别"""
  access_token = self.get_token()
  # 请求 URL
  URL = "https://aip.baidubce.com/rest/2.0/ocr/v1/accurate?access_token=" + access_token
  # post 请求头
  headers = {"Content-Type": "application/x-www-form-urlencoded"}
  # post 参数
  data = {
  "image": self.encode_img(img_path),
  "recognize_granularity": "big"
  }
  # post 请求
  response = requests.post(URL, headers=headers, data=data)
  return response.json()
  if __name__ == '__main__':
  ocr = OCR()
  img = "./imgs/fcz_01.jpg"
  str_json = ocr.img_to_str(img)
  my_str_list = str_json["words_result"]
  my_title = ["证明权利或事项", "权利人(申请人)", "义务人", "坐落", "不动产单元号", "其他", "附记"]
  column_line = 999999999
  my_word_list = []
  for data in my_str_list:
  my_list = []
  words = data["words"]
  width = data["location"]["width"]
  top = data["location"]["top"]
  left = data["location"]["left"]
  height = data["location"]["height"]
  my_list.append(words)
  my_list.append(width)
  my_list.append(top)
  my_list.append(left)
  my_list.append(height)
  my_word_list.append(my_list)
  if "不动产证明" in words:
  top_01 = top
  height_01 = height
  if "证明权利或事项" in words:
  top_02 = top
  if words in my_title:
  column_line = left + width if left + width < column_line else column_line
  row_line = (top_01 + top_02 + height) / 2
  head_list = []
  left_list = []
  right_list = []
  for data in my_word_list:
  if data[0] in my_title:
  continue
  if data[2] < row_line:
  head_list.append(data)
  elif data[3] < column_line:
  for i in my_title:
  data[0] = re.sub(i, "", data[0])
  right_list.append(data)
  else:
  right_list.append(data)
  # head 处理
  head_dict = {}
  left = 0
  for data in head_list:
  head_dict[data[3]] = data[0]
  # 排序
  head_dict = sorted(head_dict.items(), key=lambda x: x[0])
  head_str = ""
  for data in head_dict:
  head_str += data[1]
  print(head_str)
  # right 处理
  right_dict = {}
  other_list = copy.deepcopy(right_list)
  for i in range(len(my_title) - 2):
  right_dict[my_title[i]] = right_list[i][0]
  other_list.remove(right_list[i])
  right_dict[my_title[-1]] = right_list[-1][0]
  other_list.remove(right_list[-1])
  # 其他处理
  other_str = ""
  for data in other_list:
  if ":" in data[0]:
  other_str += ";"
  other_str += data[0]
  right_dict[my_title[-2]] = other_str[1:]
  print(right_dict)
  运行效果如下:
  冀(2019)**市不动产证明第00***19号
  {'证明权利或事项': '抵押权', '权利人(申请人)': '中国**************分行', '义务人': '***', '坐落': '路南区*************号', '不动产单元号': '130202*************0118', '附记': '业务编号:20190**20', '其他': '产权证书号:冀(2019)**市不动产权第00****2号;抵押物类型:土地和房屋;抵押方式:一般抵押;担保债权数额:60.00万元;债权起止时间:2019年10月24日起2049年10月24日止'}

RPA中房产证的 OCR 识别的更多相关文章

  1. Atitit  ocr识别原理 与概论 attilax总结

    Atitit  ocr识别原理 与概论 attilax总结 1.1. Ocr的过程与流程1 1.2. OCR不同技术细分略有不同,但大概原理是一样的. 即主要技术过程是:二值化(又叫归一化)----- ...

  2. 基于Python实现对PDF文件的OCR识别

    http://www.jb51.net/article/89955.htm https://pythontips.com/2016/02/25/ocr-on-pdf-files-using-pytho ...

  3. OCR识别-python版(一)

    需求:识别图片中的文字信息环境:windows系统 开发语言:python 使用工具类:1.pyocr 2.PIL 3.tesseract-ocr 步骤: 1.pyocr 网络通直接使用命令:pip ...

  4. 采用OCR识别自动识别财务报表

    一.         财务报表有什么作用 财务报表又叫会计报表,包含:资产负债表.损益表.现金流量表三表.财务报表对企业经营状况有重要的参考意义: n  全面系统地揭示企业一定时期的财务状况.经营成果 ...

  5. AI时代的OCR识别技术浅析

    人工智能这个词可谓是耳熟能详,近几年人工智能热潮再次席卷而来,引起轰动的要数google的AlphaGo,相继打败了围棋界的韩国选手李世石以及世界冠军柯洁,见证了人工智能发展的里程碑式的变革,人工智能 ...

  6. Python&selenium&tesseract自动化测试随机码、验证码(Captcha)的OCR识别解决方案参考

    在自动化测试或者安全渗透测试中,Captcha验证码的问题经常困扰我们,还好现在OCR和AI逐渐发展起来,在这块解决上越来越支撑到位. 我推荐的几种方式,一种是对于简单的验证码,用开源的一些OCR图片 ...

  7. 例子:照片的OCR识别

    来自ng的ml-003中 18_XVIII._Application_Example-_Photo_OCR 这是ng2013年在coursera上最后的一课了.这一系列的几个视频还是相比前面有些难懂, ...

  8. OCR识别-python3.5版

    刚接触,啥子都不会,按着教程走 需求:识别图片中的文字信息环境:windows系统 开发语言:python3.5 使用工具类:1.pyocr 2.PIL 3.tesseract-ocr 步骤: 1.p ...

  9. 图片文字OCR识别-tesseract-ocr

    帮助文件:https://github.com/tesseract-ocr/tesseract/blob/master/doc/tesseract.1.asc 下载地址:https://github. ...

随机推荐

  1. 常用的git和repo命令

    首先下图是git的流程图 相关概念 svn与git命令的对比 git常用命令 git log // 查看当前库的git log信息 git status ./ // 查看当前库的状态 git diff ...

  2. centos查询目标文件文件所在位置

    之前有试过whereis这种语法但是查询文件不大理想.然后找到了下边这种方式可以很好的查询目标文件的位置 #在根目录 /下查找所有叫nginx的文件 find / -name nginx

  3. sqlldr bat遇到的问题

    在编写sqlldr相关的bat脚本时,遇到执行bat后一直循环执行的问题,网上也有遇到相同问题的朋友: 链接:https://zhidao.baidu.com/question/17039912443 ...

  4. 第十六届浙江大学宁波理工学院程序设计大赛 D 雷顿女士与分队hard version(dp)

    题意 链接:https://ac.nowcoder.com/acm/contest/2995/D来源:牛客网 卡特莉接到来自某程序设计竞赛集训队的邀请,来为他们进行分队规划. 现在集训队共有n名选手, ...

  5. Python元组是什么

    引出 在使用Python过程中,列表.集合和字典是比较常用的数据结构. 列表简单说就是数组,不对,它就是数组 集合就是去重的元素结构,和JAVA中的set一样 字典就是一个key-value的键值对, ...

  6. 大数据基础--R语言(刘鹏《大数据》课后习题答案)

    1.R语言是解释性语言还是编译性语言?   解释性语言 2.简述R语言的基本功能.   R语言是一套完整的数据处理.计算和制图软件系统,主要包括以下功能: (1)数据存储和处理功能,丰富的数据读取与存 ...

  7. 12. Go 语言文件处理

    Go 语言文件处理 本章我们将带领大家深入了解一下 Go语言中的文件处理,重点在于文件而非目录或者通用的文件系统,特别是如何读写标准格式(如 XML 和 JSON 格式)的文件以及自定义的纯文本和二进 ...

  8. linux-在指定路径下查询文件夹是否存在

    我们常常在Linux下去查找文件 find / -name 'test.py' # 在根目录下查找名为test.py的文件 但是如果用查找文件的方式去查找文件夹的话,是查不到的 find / -max ...

  9. js中触发表单提交

    html代码: <form action="/test/action" method="get" id="myForm"> &l ...

  10. Ubuntu设置开机时启动的系统内核版本

    1.查看系统当前安装的所有内核版本 有两种方法 第一种: 可以查看/lib/modules下的文件夹,一个文件夹对应一个内核版本,如下图: 第二种:使用下面的命令查看: dpkg --get-sele ...