文字检测模型EAST应用详解 ckpt pb的tf加载，opencv加载

参考链接：https://github.com/argman/EAST （项目来源）

https://github.com/opencv/opencv/issues/12491 （遇到的问题）

　　　　 https://www.pyimagesearch.com/2018/08/20/opencv-text-detection-east-text-detector/ （opencv加载）

文字检测有很多比较好的现成的模型比如yolov3，pesnet，pennet，east。不一一赘述，讲一下自己跑通east的过程。

在https://github.com/argman/EAST链接中下载项目，windows下，各种包的版本要正确否则会出一些乱七八糟的错误。

运行EAST/eval.py。没有什么特别的问题要说，我在cpu下单张640*480的图能够达到每张0.4秒左右，还是非常优秀的。中英文数字都可。

但是源代码是ckpt，非常大,转成pb会稍微小点。添加：

##生成pb模型，但需要修改model.py
output_graph_def = tf.graph_util.convert_variables_to_constants(self.sess,  # The session is used to retrieve the weights
    tf.get_default_graph().as_graph_def(),  # The graph_def is used to retrieve the nodes
    ["feature_fusion/Conv_7/Sigmoid", "feature_fusion/concat_3"]
)
output_graph='D:\\work\\video\\hand_tracking_no_op\\hand_tracking\\EAST\\east_icdar2015_resnet_v1_50_rbox\\out.pb'
with tf.gfile.GFile(output_graph, "wb") as f:
    f.write(output_graph_def.SerializeToString())
print("%d ops in the final graph." % len(output_graph_def.node))

位置在eval.py中的

saver.restore(self.sess, model_path)后面。注意如果你想要opencv加载pb还要修改model.py中的内容，这个在后面一篇文章中会讲到。
生成后用tf加载，方法跟加载ckpt相似：

import os
os.environ['CUDA_VISIBLE_DEVICES'] = FLAGS.gpu_list

try:
    os.makedirs(FLAGS.output_dir)
except OSError as e:
    if e.errno != 17:
        raise

print("load_graph")
graph = load_graph(FLAGS.checkpoint_path)

input_images = graph.get_tensor_by_name(
    'import/input_images:0')

f_score = graph.get_tensor_by_name('import/feature_fusion/Conv_7/Sigmoid:0')
f_geometry = graph.get_tensor_by_name(
    'import/feature_fusion/concat_3:0')

with tf.Session(graph=graph) as sess:

    im_fn_list = get_images()
    for im_fn in im_fn_list:
        im = cv2.imread(im_fn)[:, :, ::-1]
        start_time = time.time()
        im_resized, (ratio_h, ratio_w) = resize_image(im)

        timer = {'net': 0, 'restore': 0, 'nms': 0}
        start = time.time()

        #file_writer = tf.summary.FileWriter('tmp/log', sess.graph)

        score, geometry = sess.run([f_score, f_geometry], feed_dict={
                                    input_images: [im_resized]})
        timer['net'] = time.time() - start

        boxes, timer = detect(score_map=score, geo_map=geometry, timer=timer)
        print('{} : net {:.0f}ms, restore {:.0f}ms, nms {:.0f}ms'.format(
            im_fn, timer['net']*1000, timer['restore']*1000, timer['nms']*1000))

        if boxes is not None:
            boxes = boxes[:, :8].reshape((-1, 4, 2))
            boxes[:, :, 0] /= ratio_w
            boxes[:, :, 1] /= ratio_h

        duration = time.time() - start_time
        print('[timing] {}'.format(duration))

        # save to file
        if boxes is not None:
            res_file = os.path.join(
                FLAGS.output_dir,
                '{}.txt'.format(
                    os.path.basename(im_fn).split('.')[0]))

            with open(res_file, 'w') as f:
                for box in boxes:
                    # to avoid submitting errors
                    box = sort_poly(box.astype(np.int32))
                    if np.linalg.norm(box[0] - box[1]) < 5 or np.linalg.norm(box[3]-box[0]) < 5:
                        continue
                    f.write('{},{},{},{},{},{},{},{}\r\n'.format(
                        box[0, 0], box[0, 1], box[1, 0], box[1, 1], box[2, 0], box[2, 1], box[3, 0], box[3, 1],
                    ))
                    cv2.polylines(im[:, :, ::-1], [box.astype(np.int32).reshape((-1, 1, 2))], True, color=(255, 255, 0), thickness=1)
        if not FLAGS.no_write_images:
            img_path = os.path.join(FLAGS.output_dir, os.path.basename(im_fn))
            cv2.imwrite(img_path, im[:, :, ::-1])

以上就是EAST的ckpt转pb用tf加载啦。
下一篇讲opencv加载east的pb。

文字检测模型EAST应用详解 ckpt pb的tf加载，opencv加载的更多相关文章

Kaggle网站流量预测任务第一名解决方案：从模型到代码详解时序预测
Kaggle网站流量预测任务第一名解决方案:从模型到代码详解时序预测 2017年12月13日 17:39:11 机器之心V 阅读数:5931 近日,Artur Suilin 等人发布了 Kaggl ...
Java内存模型相关原则详解
在<Java内存模型(JMM)详解>一文中我们已经讲到了Java内存模型的基本结构以及相关操作和规则.而Java内存模型又是围绕着在并发过程中如何处理原子性.可见性以及有序性这三个特征来构 ...
CSS3盒模型display:box详解
display:box;box-flex是css3新添加的盒子模型属性,它的出现可以解决我们通过N多结构.css实现的布局方式.经典的一个布局应用就是布局的垂直等高.水平均分.按比例划分. 目前box ...
基于模型的特征选择详解 (Embedded & Wrapper)
目录基于模型的特征选择详解 (Embedded & Wrapper) 1. 线性模型和正则化(Embedded方式) 2. 基于树模型的特征选择(Embedded方式) 3. 顶层特征选择算 ...
Kubernetes服务pod的健康检测liveness和readiness详解
Kubernetes服务pod的健康检测liveness和readiness详解接下来给大家讲解下在K8S上,我们如果对我们的业务服务进行健康检测. Health Check.restartPoli ...
OSI模型各层详解
1. OSI概述 1.1 模拟器说明 1.1.1 模拟器的作用搭建实验环境进行测试. 1.1.2 模拟器的类型 PT:一般是学校中使用,命令不完整,且不能抓包 GNS3:思科(CCNA,CCNP), ...
不止面试02-JVM内存模型面试题详解
第一部分:面试题本篇文章我们将尝试回答以下问题: 描述一下jvm的内存结构描述一下jvm的内存模型谈一下你对常量池的理解什么情况下会发生栈内存溢出?和内存溢出有什么不同? String str ...
DJango模型Meta选项详解
Django模型之Meta选项详解 MEAT选项 Django模型类的Meta是一个内部类,它用于定义一些Django模型类的行为特性.而可用的选项大致包含以下几类 abstract 这个属性是定义当 ...
第三十五节，目标检测之YOLO算法详解
Redmon, J., Divvala, S., Girshick, R., Farhadi, A.: You only look once: Unified, real-time object de ...

随机推荐

C 实战练习题目1
题目:有1.2.3.4个数字,能组成多少个互不相同且无重复数字的三位数?都是多少? 程序分析:可填在百位.十位.个位的数字都是1.2.3.4.组成所有的排列后再去掉不满足条件的排列. 实例: #in ...
DeepMind爆出无监督表示学习模型BigBiGAN，GAN之父点赞！
[导读]今天,DeepMind爆出一篇重磅论文,引发学术圈热烈反响:基于最强图像生成器BigGAN,打造了BigBiGAN,在无监督表示学习和图像生成方面均实现了最先进的性能!Ian Goodfell ...
iOS 响应链
一.UIResponder app 使用响应者对象接收和处理事件,只有继承 UIResponder 的类,才能处理事件. UIApplication.UIView.UIViewController 都 ...
前端经典面试题解密：JS的new关键字都干了什么？
前言 new关键字在实例化获取对象时都做了什么?是一道经常出现在前端面试时的问题.如果只是简单的了解new关键字是实例化构造函数获取对象,是万万不能够的.更深入的层级发生了什么呢?同时面试官想从这道题 ...
Linux 脏数据回刷参数与调优
简介我们知道,Linux用cache/buffer缓存数据,且有个回刷任务在适当时候把脏数据回刷到存储介质中.什么是适当的时候?换句话说,什么时候触发回刷?是脏数据达到多少阈值还是定时触发,或者两者 ...
Codeforces Round #627 (Div. 3)
1324A - Yet Another Tetris Problem(思维) 题意给一个数组,每一个数组中的元素大小表示在竖直方向的方块数量,元素相邻怎竖直方向的方块也相邻,类似于俄罗斯方块当底层被 ...
《Java基础复习》-控制执行流程
最近任务太多了,肝哭我了,boom 参考书目:Thinking in Java <Java基础复习>-控制执行流程 Java使用了C的所有流程控制语句涉及关键字:if-else.whil ...
Http协议中Cookie使用详细介绍
Cookie总是保存在客户端中,按在客户端中的存储位置,可分为内存Cookie和硬盘Cookie.内存Cookie由浏览器维护,保存在内存中,浏览器关闭后就消失了,其存在时间是短暂的.硬盘Cookie ...
Redis操作，数据库操作
Redis操作,数据库操作案例1:源码安装Redis缓存服务案例2:常用Redis数据库操作指令案例3:配置Redis主从服务器 1 案例1:源码安装Redis缓存服务 1.1 问题本案例要求 ...
java文件中字母出现的次数和百分比
主要是文件的读写.先在代码中导入文件.一行一行的进行数据的读入,通过“ ”空格对读入的信息进行分割,存入到数组里之后对于每一个单词的每一个字母进行区分存入相应的字母数组里.最后统计总的字母个数.应用 ...

文字检测模型EAST应用详解 ckpt pb的tf加载，opencv加载

文字检测模型EAST应用详解 ckpt pb的tf加载，opencv加载的更多相关文章

随机推荐

热门专题