使用tensorflow深度学习识别验证码

除了传统的PIL包处理图片,然后用pytessert+OCR识别意外,还可以使用tessorflow训练来识别验证码。

此篇代码大部分是转载的，只改了很少地方。

代码是运行在linux环境，tessorflow没有支持windows的python 2.7。

gen_captcha.py代码。

#coding=utf-8

from captcha.image import ImageCaptcha  # pip install captcha

import numpy as np

import matplotlib.pyplot as plt

from PIL import Image

import random

# 验证码中的字符, 就不用汉字了

number = ['', '', '', '', '', '', '', '', '', '']

alphabet = ['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j', 'k', 'l', 'm', 'n', 'o', 'p', 'q', 'r', 's', 't', 'u',

            'v', 'w', 'x', 'y', 'z']

ALPHABET = ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J', 'K', 'L', 'M', 'N', 'O', 'P', 'Q', 'R', 'S', 'T', 'U',

            'V', 'W', 'X', 'Y', 'Z']

'''

number=['0','1','2','3','4','5','6','7','8','9']

alphabet =[]

ALPHABET =[]

'''

# 验证码一般都无视大小写；验证码长度4个字符

def random_captcha_text(char_set=number + alphabet + ALPHABET, captcha_size=4):

    captcha_text = []

    for i in range(captcha_size):

        c = random.choice(char_set)

        captcha_text.append(c)

    return captcha_text

# 生成字符对应的验证码

def gen_captcha_text_and_image():

    while(1):

        image = ImageCaptcha()

        captcha_text = random_captcha_text()

        captcha_text = ''.join(captcha_text)

        captcha = image.generate(captcha_text)

        #image.write(captcha_text, captcha_text + '.jpg')  # 写到文件

        captcha_image = Image.open(captcha)

        #captcha_image.show()

        captcha_image = np.array(captcha_image)

        if captcha_image.shape==(60,160,3):

            break

    return captcha_text, captcha_image

if __name__ == '__main__':

    # 测试

    text, image = gen_captcha_text_and_image()

    print image

    gray = np.mean(image, -1)

    print gray

    print image.shape

    print gray.shape

    f = plt.figure()

    ax = f.add_subplot(111)

    ax.text(0.1, 0.9, text, ha='center', va='center', transform=ax.transAxes)

    plt.imshow(image)

    plt.show()

train.py代码。

#coding=utf-8

from gen_captcha import gen_captcha_text_and_image

from gen_captcha import number

from gen_captcha import alphabet

from gen_captcha import ALPHABET

import numpy as np

import tensorflow as tf

"""

text, image = gen_captcha_text_and_image()

print  "验证码图像channel:", image.shape  # (60, 160, 3)

# 图像大小

IMAGE_HEIGHT = 60

IMAGE_WIDTH = 160

MAX_CAPTCHA = len(text)

print   "验证码文本最长字符数", MAX_CAPTCHA  # 验证码最长4字符; 我全部固定为4,可以不固定. 如果验证码长度小于4，用'_'补齐

"""

IMAGE_HEIGHT = 60

IMAGE_WIDTH = 160

MAX_CAPTCHA = 4

# 把彩色图像转为灰度图像（色彩对识别验证码没有什么用）

def convert2gray(img):

    if len(img.shape) > 2:

        gray = np.mean(img, -1)

        # 上面的转法较快，正规转法如下

        # r, g, b = img[:,:,0], img[:,:,1], img[:,:,2]

        # gray = 0.2989 * r + 0.5870 * g + 0.1140 * b

        return gray

    else:

        return img

"""

cnn在图像大小是2的倍数时性能最高, 如果你用的图像大小不是2的倍数，可以在图像边缘补无用像素。

np.pad(image,((2,3),(2,2)), 'constant', constant_values=(255,))  # 在图像上补2行，下补3行，左补2行，右补2行

"""

# 文本转向量

char_set = number + alphabet + ALPHABET + ['_']  # 如果验证码长度小于4, '_'用来补齐

CHAR_SET_LEN = len(char_set)

def text2vec(text):

    text_len = len(text)

    if text_len > MAX_CAPTCHA:

        raise ValueError('验证码最长4个字符')

    vector = np.zeros(MAX_CAPTCHA * CHAR_SET_LEN)

    def char2pos(c):

        if c == '_':

            k = 62

            return k

        k = ord(c) - 48

        if k > 9:

            k = ord(c) - 55

            if k > 35:

                k = ord(c) - 61

                if k > 61:

                    raise ValueError('No Map')

        return k

    for i, c in enumerate(text):

        #print text

        idx = i * CHAR_SET_LEN + char2pos(c)

        #print i,CHAR_SET_LEN,char2pos(c),idx

        vector[idx] = 1

    return vector

#print text2vec('1aZ_')

# 向量转回文本

def vec2text(vec):

    char_pos = vec.nonzero()[0]

    text = []

    for i, c in enumerate(char_pos):

        char_at_pos = i  # c/63

        char_idx = c % CHAR_SET_LEN

        if char_idx < 10:

            char_code = char_idx + ord('')

        elif char_idx < 36:

            char_code = char_idx - 10 + ord('A')

        elif char_idx < 62:

            char_code = char_idx - 36 + ord('a')

        elif char_idx == 62:

            char_code = ord('_')

        else:

            raise ValueError('error')

        text.append(chr(char_code))

    return "".join(text)

"""

#向量（大小MAX_CAPTCHA*CHAR_SET_LEN）用0,1编码 每63个编码一个字符，这样顺利有，字符也有

vec = text2vec("F5Sd")

text = vec2text(vec)

print(text)  # F5Sd

vec = text2vec("SFd5")

text = vec2text(vec)

print(text)  # SFd5

"""

# 生成一个训练batch

def get_next_batch(batch_size=128):

    batch_x = np.zeros([batch_size, IMAGE_HEIGHT * IMAGE_WIDTH])

    batch_y = np.zeros([batch_size, MAX_CAPTCHA * CHAR_SET_LEN])

    # 有时生成图像大小不是(60, 160, 3)

    def wrap_gen_captcha_text_and_image():

        while True:

            text, image = gen_captcha_text_and_image()

            if image.shape == (60, 160, 3):

                return text, image

    for i in range(batch_size):

        text, image = wrap_gen_captcha_text_and_image()

        image = convert2gray(image)

        batch_x[i, :] = image.flatten() / 255  # (image.flatten()-128)/128  mean为0

        batch_y[i, :] = text2vec(text)

    return batch_x, batch_y

####################################################################

X = tf.placeholder(tf.float32, [None, IMAGE_HEIGHT * IMAGE_WIDTH])

Y = tf.placeholder(tf.float32, [None, MAX_CAPTCHA * CHAR_SET_LEN])

keep_prob = tf.placeholder(tf.float32)  # dropout

# 定义CNN

def crack_captcha_cnn(w_alpha=0.01, b_alpha=0.1):

    x = tf.reshape(X, shape=[-1, IMAGE_HEIGHT, IMAGE_WIDTH, 1])

    # w_c1_alpha = np.sqrt(2.0/(IMAGE_HEIGHT*IMAGE_WIDTH)) #

    # w_c2_alpha = np.sqrt(2.0/(3*3*32))

    # w_c3_alpha = np.sqrt(2.0/(3*3*64))

    # w_d1_alpha = np.sqrt(2.0/(8*32*64))

    # out_alpha = np.sqrt(2.0/1024)

    # 3 conv layer

    w_c1 = tf.Variable(w_alpha * tf.random_normal([3, 3, 1, 32]))

    b_c1 = tf.Variable(b_alpha * tf.random_normal([32]))

    conv1 = tf.nn.relu(tf.nn.bias_add(tf.nn.conv2d(x, w_c1, strides=[1, 1, 1, 1], padding='SAME'), b_c1))

    conv1 = tf.nn.max_pool(conv1, ksize=[1, 2, 2, 1], strides=[1, 2, 2, 1], padding='SAME')

    conv1 = tf.nn.dropout(conv1, keep_prob)

    w_c2 = tf.Variable(w_alpha * tf.random_normal([3, 3, 32, 64]))

    b_c2 = tf.Variable(b_alpha * tf.random_normal([64]))

    conv2 = tf.nn.relu(tf.nn.bias_add(tf.nn.conv2d(conv1, w_c2, strides=[1, 1, 1, 1], padding='SAME'), b_c2))

    conv2 = tf.nn.max_pool(conv2, ksize=[1, 2, 2, 1], strides=[1, 2, 2, 1], padding='SAME')

    conv2 = tf.nn.dropout(conv2, keep_prob)

    w_c3 = tf.Variable(w_alpha * tf.random_normal([3, 3, 64, 64]))

    b_c3 = tf.Variable(b_alpha * tf.random_normal([64]))

    conv3 = tf.nn.relu(tf.nn.bias_add(tf.nn.conv2d(conv2, w_c3, strides=[1, 1, 1, 1], padding='SAME'), b_c3))

    conv3 = tf.nn.max_pool(conv3, ksize=[1, 2, 2, 1], strides=[1, 2, 2, 1], padding='SAME')

    conv3 = tf.nn.dropout(conv3, keep_prob)

    # Fully connected layer

    w_d = tf.Variable(w_alpha * tf.random_normal([8 * 32 * 40, 1024]))

    b_d = tf.Variable(b_alpha * tf.random_normal([1024]))

    dense = tf.reshape(conv3, [-1, w_d.get_shape().as_list()[0]])

    dense = tf.nn.relu(tf.add(tf.matmul(dense, w_d), b_d))

    dense = tf.nn.dropout(dense, keep_prob)

    w_out = tf.Variable(w_alpha * tf.random_normal([1024, MAX_CAPTCHA * CHAR_SET_LEN]))

    b_out = tf.Variable(b_alpha * tf.random_normal([MAX_CAPTCHA * CHAR_SET_LEN]))

    out = tf.add(tf.matmul(dense, w_out), b_out)

    # out = tf.nn.softmax(out)

    return out

# 训练

def train_crack_captcha_cnn():

    import time

    start_time=time.time()

    output = crack_captcha_cnn()

    # loss

    #loss = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(output, Y))

    loss = tf.reduce_mean(tf.nn.sigmoid_cross_entropy_with_logits(logits=output, labels=Y))

    # 最后一层用来分类的softmax和sigmoid有什么不同？

    # optimizer 为了加快训练 learning_rate应该开始大，然后慢慢衰

    optimizer = tf.train.AdamOptimizer(learning_rate=0.001).minimize(loss)

    predict = tf.reshape(output, [-1, MAX_CAPTCHA, CHAR_SET_LEN])

    max_idx_p = tf.argmax(predict, 2)

    max_idx_l = tf.argmax(tf.reshape(Y, [-1, MAX_CAPTCHA, CHAR_SET_LEN]), 2)

    correct_pred = tf.equal(max_idx_p, max_idx_l)

    accuracy = tf.reduce_mean(tf.cast(correct_pred, tf.float32))

    saver = tf.train.Saver()

    with tf.Session() as sess:

        sess.run(tf.global_variables_initializer())

        step = 0

        while True:

            batch_x, batch_y = get_next_batch(64)

            _, loss_ = sess.run([optimizer, loss], feed_dict={X: batch_x, Y: batch_y, keep_prob: 0.75})

            print time.strftime('%Y-%m-%d %H:%M:%S',time.localtime(time.time())),step, loss_

            # 每100 step计算一次准确率

            if step % 100 == 0:

                batch_x_test, batch_y_test = get_next_batch(100)

                acc = sess.run(accuracy, feed_dict={X: batch_x_test, Y: batch_y_test, keep_prob: 1.})

                print u'***************************************************************第%s次的准确率为%s'%(step, acc)

                # 如果准确率大于50%,保存模型,完成训练

                if acc > 0.9:                  ##我这里设了0.9，设得越大训练要花的时间越长，如果设得过于接近1，很难达到。如果使用cpu，花的时间很长，cpu占用很高电脑发烫。

                    saver.save(sess, "crack_capcha.model", global_step=step)

                    print time.time()-start_time

                    break

            step += 1

train_crack_captcha_cnn()

测试代码：

output = crack_captcha_cnn()

saver = tf.train.Saver()

sess = tf.Session()

saver.restore(sess, tf.train.latest_checkpoint('.'))

while(1):

    text, image = gen_captcha_text_and_image()

    image = convert2gray(image)

    image = image.flatten() / 255

    predict = tf.argmax(tf.reshape(output, [-1, MAX_CAPTCHA, CHAR_SET_LEN]), 2)

    text_list = sess.run(predict, feed_dict={X: [image], keep_prob: 1})

    predict_text = text_list[0].tolist()

    vector = np.zeros(MAX_CAPTCHA * CHAR_SET_LEN)

    i = 0

    for t in predict_text:

        vector[i * 63 + t] = 1

        i += 1

        # break

    print("正确: {}  预测: {}".format(text, vec2text(vector)))

如果想要快点测试代码效果，验证码的字符不要设置太多，例如0123这几个数字就可以了。

使用tensorflow深度学习识别验证码的更多相关文章

TensorFlow - 深度学习破解验证码实验
TensorFlow - 深度学习破解验证码简介:验证码主要用于防刷,传统的验证码识别算法一般需要把验证码分割为单个字符,然后逐个识别,如果字符之间相互重叠,传统的算法就然并卵了,本文采用cnn对验 ...
没有博士学位，照样玩转TensorFlow深度学习
教程 | 没有博士学位,照样玩转TensorFlow深度学习机器之心2017-01-24 12:32:22 程序设计谷歌操作系统阅读(362)评论(0) 选自Codelabs 机器之心编译参 ...
（转） TensorFlow深度学习，一篇文章就够了
TensorFlow深度学习,一篇文章就够了 2016/09/22 · IT技术 · TensorFlow, 深度学习分享到:6 原文出处: 我爱计算机 (@tobe迪豪 ) 作者: 陈迪 ...
深度学习识别CIFAR10：pytorch训练LeNet、AlexNet、VGG19实现及比较（三）
版权声明:本文为博主原创文章,欢迎转载,并请注明出处.联系方式:460356155@qq.com VGGNet在2014年ImageNet图像分类任务竞赛中有出色的表现.网络结构如下图所示: 同样的, ...
深度学习识别CIFAR10：pytorch训练LeNet、AlexNet、VGG19实现及比较（二）
版权声明:本文为博主原创文章,欢迎转载,并请注明出处.联系方式:460356155@qq.com AlexNet在2012年ImageNet图像分类任务竞赛中获得冠军.网络结构如下图所示: 对CIFA ...
MINIST深度学习识别：python全连接神经网络和pytorch LeNet CNN网络训练实现及比较（三）
版权声明:本文为博主原创文章,欢迎转载,并请注明出处.联系方式:460356155@qq.com 在前两篇文章MINIST深度学习识别:python全连接神经网络和pytorch LeNet CNN网 ...
TensorFlow深度学习，一篇文章就够了
http://blog.jobbole.com/105602/ 作者: 陈迪豪,就职小米科技,深度学习工程师,TensorFlow代码提交者. TensorFlow深度学习框架 Google不仅是大数 ...
windows下Anaconda3配置TensorFlow深度学习库
Anaconda3(python3.6)安装tensorflow Anaconda3中安装tensorflow3是非常简单的,仅需通过 pip install tensorflow 测试代码: imp ...
问题集录--TensorFlow深度学习
TensorFlow深度学习框架 Google不仅是大数据和云计算的领导者,在机器学习和深度学习上也有很好的实践和积累,在2015年年底开源了内部使用的深度学习框架TensorFlow. 与Caffe ...

随机推荐

jQuery的使用说明
jQuery是一款同prototype一样优秀js开发库类,特别是对css和XPath的支持,使我们写js变得更加方便!如果你不是个js高手又想写出优秀的js效果,jQuery可以帮你达到目的! ...
LeetCode: Spiral Matrix II 解题报告-三种方法解决旋转矩阵问题
Spiral Matrix IIGiven an integer n, generate a square matrix filled with elements from 1 to n2 in sp ...
LeetCode: Candy 解题报告
Candy There are N children standing in a line. Each child is assigned a rating value. You are giving ...
Frosh Week
Problem Description During Frosh Week, students play various fun games to get to know each other and ...
hud1700（计算几何——求等边三角形）
题意:圆心在原点,一个坐标(x,y)在圆上,通过这个点画一个三角形在圆内,三角形其顶点都在圆上,要求三角形的周长最大,输出满足这样条件的三角形的另两个坐标..... 思路:有一个公式是把一个向量平移多 ...
基于html5整屏切换IDO智能手表页面滚动代码
之前为大大家介绍了一款jquery实现的整屏切换特效.今天分享一款IDO智能手表页面滚动html5代码.这是一款基于jQuery+HTML5实现的页面滚动效果代码.效果图如下: 在线预览源码下载 ...
java日期工具类DateUtil-续二
该版本是一次较大的升级,农历相比公历复杂太多(真佩服古人的智慧),虽然有规律,但涉及到的取舍.近似的感念太多,况且本身的概念就已经很多了,我在网上也是查阅了很多的资料,虽然找到一些计算的方法,但都有些 ...
vim 移植记录
下载两个源码包: vim : ftp://ftp.vim.org/pub/vim/unix/vim-7.4.tar.bz2\ ncurses-5.8.tar.gz http://ftp.gnu.org ...
java——关于异常处理机制的简单原理和应用
异常处理机制的简单原理和应用一.Execption可以分为java标准定义的异常和程序员自定义异常2种 (1)一种是当程序违反了java语规则的时候,JAVA虚拟机就会将发生的错误表示为一个异常.这 ...
html块状元素、内联元素
html块状元素.内联元素原文在这块级元素的分类块级元素按照其应用于结构还是内容分为三种:结构化块状元素,终端块状元素,多目标块状元素. 一.结构化块状元素这类元素用于构造文档的结构,一个好的 ...

使用tensorflow深度学习识别验证码

使用tensorflow深度学习识别验证码的更多相关文章

随机推荐

热门专题