Text Region Mask

本系列文章由 @yhl_leo 出品，转载请注明出处。

文章链接： http://blog.csdn.net/yhl_leo/article/details/52886351

根据图像中文本字符的坐标信息，生成文本区域mask图像。如下图

文本字符信息记录格式为：

bjtextset01_0004.jpg

1

1 527.50 243.50 581.67 311.00 "2"

其中，bjtextset01_0004.jpg为图像名（全小写字符），紧接着的1为包含文本字符的数量，后面接着就是对应的文本字符的位置坐标527.50 243.50 581.67 311.00（格式为x, y, x, y，即两个顶点坐标），2为字符内容，该行最前面的1为标记符，可以忽略。

首先，读取文本内容：

import os

import copy as cp

class DataGt(object):

    """docstring for DataGt"""

    def __init__(self, fname, trlist):

        super(DataGt, self).__init__()

        self.fname = fname

        self.trlist = trlist

def loaddata(path):

    fp = open(path).read().splitlines()

    gt = DataGt([],[])

    niter = 0

    idx = 0

    while niter < len(fp):

        if '.jpg' in fp[idx]:

            textlst = []

            gt.fname.append(fp[idx]);

            idx = idx + 1

            num = int(fp[idx])

            for i in range(num):

                idx = idx + 1

                if '1' in fp[idx] and '\"' in fp[idx]:

                    loc = fp[idx].split(' ')[1:5]

                    textlst.append(loc)

            gt.trlist.append(textlst)

        else:

            idx = idx + 1

        niter = idx

    return gt

然后，绘制mask图：

import os

import cv2

import loadgt

import numpy as np

def im_lists( path ):

    return os.listdir(path);

def path_insensitive(lst, fn):

    for ln in lst:

        if ln.lower() == fn.lower():

            return ln

    return None

def genMask(gt, im_path, savepath):

    num = len(gt.fname)

    ims = im_lists(im_path)

    for idx in range(num):

        fn = path_insensitive( ims, gt.fname[idx] )

        fname = os.path.join(im_path, fn)

        sname = os.path.join(savepath, fn)

        im = cv2.imread(fname)

        size_im = im.shape

        #print size_im

        mask = np.zeros([size_im[0], size_im[1]], dtype=np.uint8)

        for ls in gt.trlist[idx]:

            mask[int(float(ls[1])):int(float(ls[3])), int(float(ls[0])): int(float(ls[2]))] = 255

        cv2.imwrite(sname, mask, [cv2.cv.CV_IMWRITE_PNG_COMPRESSION, 0])

im_path = "./data"

savepath = "./mask"

gtpath = "./test.txt"

gt = loadgt.loaddata(gtpath)

genMask(gt,im_path, savepath)

结果如图：

Image	TextRegionMask

Text Region Mask的更多相关文章

【论文速读】Shangbang Long_ECCV2018_TextSnake_A Flexible Representation for Detecting Text of Arbitrary Shapes
Shangbang Long_ECCV2018_TextSnake_A Flexible Representation for Detecting Text of Arbitrary Shapes 作 ...
论文阅读（Xiang Bai——【arXiv2016】Scene Text Detection via Holistic, Multi-Channel Prediction）
Xiang Bai--[arXiv2016]Scene Text Detection via Holistic, Multi-Channel Prediction 目录作者和相关链接方法概括创新 ...
论文阅读（Xiang Bai——【CVPR2015】Symmetry-Based Text Line Detection in Natural Scenes）
Xiang Bai--[CVPR2015]Symmetry-Based Text Line Detection in Natural Scenes 目录作者和相关链接方法概括创新点和贡献方法细 ...
论文速读（Chuhui Xue——【arxiv2019】MSR_Multi-Scale Shape Regression for Scene Text Detection）
Chuhui Xue--[arxiv2019]MSR_Multi-Scale Shape Regression for Scene Text Detection 论文 Chuhui Xue--[arx ...
【论文速读】Yuliang Liu_2017_Detecting Curve Text in the Wild_New Dataset and New Solution
Yuliang Liu_2017_Detecting Curve Text in the Wild_New Dataset and New Solution 作者和代码 caffe版代码关键词文字 ...
【论文速读】Chuhui Xue_ECCV2018_Accurate Scene Text Detection through Border Semantics Awareness and Bootstrapping
Chuhui Xue_ECCV2018_Accurate Scene Text Detection through Border Semantics Awareness and Bootstrappi ...
论文阅读（Weilin Huang——【arXiv2016】Accurate Text Localization in Natural Image with Cascaded Convolutional Text Network）
Weilin Huang——[arXiv2016]Accurate Text Localization in Natural Image with Cascaded Convolutional Tex ...
halcon 如何把一个region截取出来保存为图像
read_image(Image,'monkey') gen_circle(region,200,200,150) reduce_domain(Image,region,Mask) crop_doma ...
Region Normalization for Image Inpainting, AAAI 2020
论文:Region Normalization for Image Inpainting, AAAI 2020 代码:https://github.com/geekyutao/RN 图像修复的目的是重 ...

随机推荐

似水流年 ? Chrome调试大全
http://www.360doc.com/content/12/1107/20/7851074_246467307.shtml 作为一名前端开发者,打交道最多的可能是和浏览器.市面上各种浏览器多 ...
LibreOJ #514. 「LibreOJ β Round #2」模拟只会猜题意
内存限制:256 MiB 时间限制:1000 ms 标准输入输出题目类型:传统评测方式:文本比较题目描述给定一个长度为 nnn 的序列 AAA . 定义 f(l,r)=∑i=lrAif(l,r ...
洛谷 P2383 狗哥玩木棒
题目背景狗哥又趁着语文课干些无聊的事了... 题目描述现给出一些木棒长度,那么狗哥能否用给出的木棒(木棒全用完)组成一个正方形呢? 输入输出格式输入格式: 输入文件中的第一行是一个整数n表示测试 ...
多目标检测分类 RCNN到Mask R-CNN
最近做目标检测需要用到Mask R-CNN,之前研究过CNN,R-CNN:通过论文的阅读以及下边三篇博客大概弄懂了Mask R-CNN神经网络.想要改进还得努力啊... 目标检测的经典网络结构,顺序大 ...
Codeforces Round #320 (Div. 1) [Bayan Thanks-Round] C A Weakness and Poorness （三分）
显然f(x)是个凹函数,三分即可,计算方案的时候dp一下.eps取大了会挂精度,指定循环次数才是正解. #include<bits/stdc++.h> using namespace st ...
git 作成
Git global setup git config --global user.name "高文龍" git config --global user.email " ...
Luogu [P3951] 小凯的疑惑
题目详见:[P3951]小凯的疑惑首先说明:此题为一道提高组的题.但其实代码并没有提高组的水平.主要考的是我们的推断能力,以及看到题后的分析能力. 分析如下: 证明当k>ab-a-b时,小凯可 ...
C#数组删除元素
一.C#数组删除元素在C#中,只能在动态数组ArrayList类中对数组执行删除元素的操作.因为动态数组是一个可以改变数组长度和元素个数的数据类型. 示例: using System;using S ...
【转】MFC右键显示菜单之LoadMenu()
如何在界面内单击右键弹出自己设置的菜单选项? 步骤如下: 1.在资源MENU里添加一个菜单资源,命名为IDR_POP_MENU. 2.在自己添加的菜单中添加事件,如事件1,事件2,事件3,分别添加响应 ...
洛谷 P2717 寒假作业
https://www.luogu.org/problemnew/show/P2717 $n \le 1004枚举区间,挨个计算,判断,时间复杂度$O(n^3)$. $n \le 5000$,预处理出 ...

Text Region Mask

Text Region Mask的更多相关文章

随机推荐

热门专题