使用tensorflow搭建自己的验证码识别系统

准备验证码数据
保存为tfrecords文件
验证码训练

学习tensorflow有一段时间了，想做点东西来练一下手。为了更有意思点，下面将搭建一个简单的验证码识别系统。

准备验证码数据

下面将生成一万张四位英文字母的验证码，验证码的大小是100 * 30的图片，只包含大写的英文字母，并将目标值保存到csv文件。

import random

import pandas as pd

from PIL import Image, ImageDraw, ImageFont

def generate_captcha(filename, format):

    """

    生成四位验证码

    :param filename: 要保存的文件名

    :param format: 保存图片格式

    :return: 验证码的值

    """

    # 定义使用Image类实例化一个长为100px,宽为30px,基于RGB的(255,255,255)颜色的图片

    img = Image.new(mode="RGB", size=(100, 30), color=(255, 255, 255))

    # 实例化一支画笔

    draw = ImageDraw.Draw(img, mode="RGB")

    # 定义要使用的字体

    font = ImageFont.truetype("arial", 28)

    result = ""

    for i in range(4):

        # 每循环一次,从a到z中随机生成一个字母

        # 65到90为字母的ASCII码,使用chr把生成的ASCII码转换成字符

        # str把生成的数字转换成字符串

        char = random.choice([chr(random.randint(65, 90))])

        result += char

        # 每循环一次重新生成随机颜色

        color = (random.randint(0, 255), random.randint(0, 255), random.randint(0, 255))

        # 把生成的字母或数字添加到图片上

        # 图片长度为100px,要生成4个数字或字母则每添加一个,其位置就要向后移动24px

        draw.text([i * 24 + 3, 0], char, color, font=font)

    # 保存生成的文件

    with open(filename, "wb") as f:

        img.save(f, format=format)

    return result

if __name__ == "__main__":

    data = []

    # 生成10000张验证码图片，并将目标值存入csv文件

    for j in range(10000):

        val = generate_captcha("./pics/{}.png".format(j), "png")

        data.append([val])

    # 将验证码的值保存到csv文件

    df = pd.DataFrame(data, columns=['label'])

    df.to_csv('./pics/data.csv', header=False)

生成的验证码图片是这样子的，如下：

csv文件内容：

0,EFGQ

1,ZDKO

2,UWLD

3,CPDH

....

保存为tfrecords文件

上面生成的图片和其目标值是分开的，在进行训练时不太方便（训练时每次都要单独的读取图片和特征值）。保存为tfrecords文件，在训练时会方便很多，读取出来的每条记录既有图片特征值又有目标值。

import tensorflow as tf

import os

import numpy as np

class CaptchaInput(object):

    def __init__(self, captcha_dir, letter, tfrecords_dir):

        """

        :param captcha_dir: 验证码路径

        :param letter: 验证码字符种类

        :param tfrecords_dir: tfrecords文件保存的目录

        """

        self.captcha_dir = captcha_dir

        self.letter = letter

        self.tfrecords_dir = tfrecords_dir

        # 列出图片文件，并进行排序

        self.file_list = os.listdir(self.captcha_dir)

        self.file_list = [i for i in self.file_list if i.endswith(".png")]

        self.file_list.sort(key=lambda x: int(x[0:-4]))

        self.file_list = [os.path.join(self.captcha_dir, i) for i in self.file_list]

        # 标签文件路径

        self.labels_path = os.path.join(self.captcha_dir, "data.csv")

    def read_captcha_image(self):

        """读取验证码图片数据"""

        # 构造文件队列

        file_queue = tf.train.string_input_producer(self.file_list, shuffle=False)

        # 构建阅读器

        reader = tf.WholeFileReader()

        # 读取图片内容

        key, value = reader.read(file_queue)

        # 解码图片

        image = tf.image.decode_png(value)

        image.set_shape([30, 100, 3])

        # 批量读取

        image_batch = tf.train.batch([image], batch_size=len(self.file_list),

                                     num_threads=1, capacity=len(self.file_list))

        return image_batch

    def read_captcha_label(self):

        """读取 验证码标签数据"""

        # 构造文件队列

        file_queue = tf.train.string_input_producer([self.labels_path], shuffle=False)

        # 构建文件阅读器

        reader = tf.TextLineReader()

        # 读取标签内容

        key, value = reader.read(file_queue)

        records = [[0], [""]]

        index, label = tf.decode_csv(value, record_defaults=records)

        # 批量读取

        label_batch = tf.train.batch([label], batch_size=len(self.file_list),

                                     num_threads=1, capacity=len(self.file_list))

        return label_batch

    def process_labels(self, labels):

        """将标签字符转换成数字张量"""

        # 构建字符索引

        num_letter_dict = dict(enumerate(list(self.letter)))

        letter_num_dict = dict(zip(num_letter_dict.values(), num_letter_dict.keys()))

        ret = []

        for label in labels:

            arr = [letter_num_dict[i] for i in label.decode("utf-8")]

            ret.append(arr)

        return np.array(ret)

    def write_to_tfrecords(self, images, labels):

        """

        将图片和标签写入到tfrecords文件中

        :param images: 特征值

        :param labels: 目标值

        :return:

        """

        # labels = tf.cast(labels, tf.uint8)

        # images = tf.cast(images, tf.uint8)

        # 建立存储文件

        fw = tf.python_io.TFRecordWriter(self.tfrecords_dir)

        for i in range(len(self.file_list)):

            # images[i]为numpy.ndarray

            image_bytes = images[i].tobytes()

            # labels[i]为numpy.ndarray

            label_bytes = labels[i].tobytes()

            example = tf.train.Example(features=tf.train.Features(feature={

                "image": tf.train.Feature(bytes_list=tf.train.BytesList(value=[image_bytes])),

                "label": tf.train.Feature(bytes_list=tf.train.BytesList(value=[label_bytes]))

            }))

            print("保存第%d张图片" % (i, ))

            fw.write(example.SerializeToString())

        # 关闭

        fw.close()

    def execute(self):

        image_batch = self.read_captcha_image()

        label_batch = self.read_captcha_label()

        with tf.Session() as sess:

            coord = tf.train.Coordinator()

            threads = tf.train.start_queue_runners(sess, coord=coord)

            # [b'EFGQ' b'ZDKO' b'UWLD' ... b'TKPD' b'ZZEU' b'ATYA']

            labels = sess.run(label_batch)

            # labels为numpy.ndarray

            labels = self.process_labels(labels)

            # images为numpy.ndarray

            images = sess.run(image_batch)

            self.write_to_tfrecords(images, labels)

            coord.request_stop()

            coord.join(threads)

FLAGS = tf.app.flags.FLAGS

tf.app.flags.DEFINE_string("captcha_dir", "./pics", "验证码图片路径")

tf.app.flags.DEFINE_string("letter", "ABCDEFGHIJKLMNOPQRSTUVWXYZ", "验证码字符种类")

tf.app.flags.DEFINE_string("tfrecords_dir", "./tfrecords/captcha.tfrecords", "验证码tfrecords文件")

if __name__ == "__main__":

    c = CaptchaInput(FLAGS.captcha_dir, FLAGS.letter, FLAGS.tfrecords_dir)

    c.execute()

需要注意：

os.listdir返回的文件名称的顺序是按照ascii表的顺序（1.png, 10.png...）需要对其进行排序
使用tensorflow读取图片和标签文件时，需要加上shuffle=False，避免文件乱序了，图片和目标值对应不上。

验证码训练

import tensorflow as tf

FLAGS = tf.app.flags.FLAGS

tf.app.flags.DEFINE_string("captcha_dir", "./tfrecords/captcha.tfrecords", "验证码数据文件")

tf.app.flags.DEFINE_integer("batch_size", 100, "每批次训练样本数")

def read_and_decode():

    """读取验证码数据

    :return image_batch, label_batch

    """

    # 文件队列

    file_queue = tf.train.string_input_producer([FLAGS.captcha_dir])

    # 文件读取器

    reader = tf.TFRecordReader()

    # 读取内容

    key, value = reader.read(file_queue)

    # 解析tfrecords

    features = tf.parse_single_example(value, features={

        "image": tf.FixedLenFeature([], tf.string),

        "label": tf.FixedLenFeature([], tf.string)

    })

    # 解码

    image = tf.decode_raw(features["image"], tf.uint8)

    label = tf.decode_raw(features["label"], tf.uint8)

    # print(image, label)

    # 改变形状

    image_reshape = tf.reshape(image, [30, 100, 3])

    label_reshape = tf.reshape(label, [4])

    # print(image_reshape, label_reshape)

    # 批处理

    image_batch, label_batch = tf.train.batch([image_reshape, label_reshape],

                                              batch_size=FLAGS.batch_size, num_threads=1, capacity=FLAGS.batch_size)

    return image_batch, label_batch

def weight_variables(shape):

    """权重初始化函数"""

    w = tf.Variable(tf.random_normal(shape=shape, mean=0.0, stddev=1.0))

    return w

def bias_variables(shape):

    """偏置初始化函数"""

    b = tf.Variable(tf.constant(0.0, shape=shape))

    return b

def fc_model(image):

    """全连接模型"""

    with tf.variable_scope("fc_model"):

        image_reshape = tf.reshape(image, [-1, 30 * 100 * 3])

        # 随机初始化权重和偏重

        weights = weight_variables([30 * 100 * 3, 4 * 26])

        bias = bias_variables([4 * 26])

        # 全连接计算

        y_predict = tf.matmul(tf.cast(image_reshape, tf.float32), weights) + bias

    return y_predict

def label_to_onehot(label):

    """目标值转换成one-hot编码"""

    label_onehot = tf.one_hot(label, depth=26, on_value=1.0, axis=2)

    return label_onehot

def captcharec():

    """验证码识别"""

    image_batch, label_batch = read_and_decode()

    # [100, 104]

    y_predict = fc_model(image_batch)

    y_true = label_to_onehot(label_batch)

    # softmax计算，交叉熵损失计算

    with tf.variable_scope("soft_cross"):

        loss = tf.nn.softmax_cross_entropy_with_logits(

            labels=tf.reshape(y_true, [-1, 4 * 26]),

            logits=y_predict

        )

    # 梯度下降损失优化

    with tf.variable_scope("optimizer"):

        train_op = tf.train.GradientDescentOptimizer(0.01).minimize(loss)

    # 准确率

    with tf.variable_scope("acc"):

        equal_list = tf.equal(tf.argmax(y_true, 2), tf.argmax(tf.reshape(y_predict, [-1, 4, 26]), 2))

        accuracy = tf.reduce_mean(tf.cast(equal_list, tf.float32))

    init_op = tf.global_variables_initializer()

    with tf.Session() as sess:

        sess.run(init_op)

        coord = tf.train.Coordinator()

        threads = tf.train.start_queue_runners(sess, coord=coord)

        for i in range(3000):

            sess.run(train_op)

            print("第%d次训练的准确率为：%f" % (i, accuracy.eval()))

        coord.request_stop()

        coord.join(threads)

if __name__ == '__main__':

    captcharec()

使用tensorflow搭建自己的验证码识别系统的更多相关文章

Tensorflow搭建CNN实现验证码识别
完整代码:GitHub 我的简书:Awesome_Tang的简书整个项目代码分为三部分: Generrate_Captcha: 生成验证码图片(训练集,验证集和测试集): 读取图片数据和标签(标签即 ...
windows下简单验证码识别——完美验证码识别系统
此文已由作者徐迪授权网易云社区发布. 欢迎访问网易云社区,了解更多网易技术产品运营经验. 讲到验证码识别,大家第一个可能想到tesseract.诚然,对于OCR而言,tesseract确实很强大,自带 ...
AI识万物：从0搭建和部署手语识别系统 ⛵
作者:韩信子@ShowMeAI 深度学习实战系列:https://www.showmeai.tech/tutorials/42 计算机视觉实战系列: https://www.showmeai.tech ...
基于TensorFlow的车牌号识别系统
简介过去几周我一直在涉足深度学习领域,尤其是卷积神经网络模型.最近,谷歌围绕街景多位数字识别技术发布了一篇不错的paper.该文章描述了一个用于提取街景门牌号的单个端到端神经网络系统.然后,作者阐述 ...
谷歌开源的TensorFlow Object Detection API视频物体识别系统实现教程
视频中的物体识别摘要物体识别(Object Recognition)在计算机视觉领域里指的是在一张图像或一组视频序列中找到给定的物体.本文主要是利用谷歌开源TensorFlow Object De ...
谷歌开源的TensorFlow Object Detection API视频物体识别系统实现(一)[超详细教程] ubuntu16.04版本
谷歌宣布开源其内部使用的 TensorFlow Object Detection API 物体识别系统.本教程针对ubuntu16.04系统,快速搭建环境以及实现视频物体识别系统功能. 本节首先介绍安 ...
对于谷歌开源的TensorFlow Object Detection API视频物体识别系统实现教程
本教程针对Windows10实现谷歌近期公布的TensorFlow Object Detection API视频物体识别系统,其他平台也可借鉴. 本教程将网络上相关资料筛选整合(文末附上参考资料链接) ...
谷歌开源的TensorFlow Object Detection API视频物体识别系统实现(二)[超详细教程] ubuntu16.04版本
本节对应谷歌开源Tensorflow Object Detection API物体识别系统 Quick Start步骤(一): Quick Start: Jupyter notebook for of ...
强智教务系统验证码识别 Tensorflow CNN
强智教务系统验证码识别 Tensorflow CNN 一直都是使用API取得数据,但是API提供的数据较少,且为了防止API关闭,先把验证码问题解决使用Tensorflow训练模型,强智教务系统的验 ...

随机推荐

页面性能优化-原生JS实现图片懒加载
在项目开发中,我们往往会遇到一个页面需要加载很多图片的情况.我们可以一次性加载全部的图片,但是考虑到用户有可能只浏览部分图片.所以我们需要对图片加载进行优化,只加载浏览器窗口内的图片,当用户滚动时,再 ...
解决tomcat部署项目中碰到的几个问题
在tomcat上部署项目并进行测试,经常会碰到各种问题.在不同的操作系统上部署,对问题的解决也会有一些差异. 1 发现问题 1.1 项目部署先将项目达成war包,放到tomcat的webapps目录 ...
springboot中HandlerMethodArgumentResolver的使用
springboot项目中在所有的controller方法中想增加token验证,即所有的方法都必须登陆有token之后才能访问.springboot封装了SpringMVC中的HandlerMeth ...
Spring Boot入门(五)：使用JDBC访问MySql数据库
本系列博客记录自己学习Spring Boot的历程,如帮助到你,不胜荣幸,如有错误,欢迎指正! 在程序开发的过程中,操作数据库是必不可少的部分,前面几篇博客中,也一直未涉及到数据库的操作,本篇博客就 ...
联发科AIoT平台i500处理器简介
i500是一款强大而高效的AIoT平台,专为便携式.家用或商用物联网应用而设计,这些应用需要大量的边缘处理.先进的多媒体功能.多台高分辨率相机.相连的触屏显示器和多任务操作系统. 该平台集成了Arm ...
003-005：Java平台相关的面试题
本文首发于公众号:javaadu 003:字节码是什么? 在Java中,字节码存放于以.class结尾的二进制文件. 字节码之于Java,类似于汇编语言之于C/C++.对于C/C++语言来说,不同的平 ...
SSIS-导入Excel文件时记录行号
SSIS导入Excel时记录行号 1. "Excel源"后添加"脚本组件" 2. "脚本组件"中新增输出列,命名为"RowNumb ...
Windows Server 2016-启用默认Windows搜索服务
当我们使用Windows Server 2016尝试从开始菜单或基于Windows Server 2016的计算机上的Cortana 搜索时,我们不会收到任何结果或不一致的结果. 原因默认情况下, ...
flink源码编译（windows环境）
前言最新开始捣鼓flink,fucking the code之前,编译是第一步. 编译环境 win7 java maven 编译步骤 https://ci.apache.org/projects/f ...
Kubernetes初探[1]：部署你的第一个ASP.NET Core应用到k8s集群
Kubernetes简介 Kubernetes是Google基于Borg开源的容器编排调度引擎,作为CNCF(Cloud Native Computing Foundation)最重要的组件之一,它的 ...