coco数据集标注图转为二值图python（附代码）

coco数据集大概有8w张以上的图片，而且每幅图都有精确的边缘mask标注。

后面后分享一个labelme标注的json或xml格式转二值图的源码（以备以后使用）

而我现在在研究显著性目标检测，需要的是边缘mask的二值图像。搜了很久，并没有人做过这种工作，只能得到如下的掩膜图

而我需要的图像为二值图，如下

说下我的过程并附上代码：

首先，coco数据集将所有的8w多张图片标注信息整合到一个json文件中，所以我们需要将单张图片标注信息json文件提取出来，以下是批量提取脚本。

注：需要改动地方 1）第6行：将json_file改为原coco数据集json文件的地址（coco/annotations/xxxxx.json）

2) 第13行：设置需要提取的图片数量我是提取82000张

3）第37行：设置存储json文件的目录需要新建空文件夹我是放在./coco_single_object下

4）第33-35行：可选将图片的名称写入data.txt中不需要的话可以注释掉

 # -*- coding:utf-8 -*-

 from __future__ import print_function

 import json

 #json文件的地址 需要手动设置

 json_file='../pycocotools/instances_train2014.json' # # Object Instance 类型的标注

 # person_keypoints_val2017.json  # Object Keypoint 类型的标注格式

 # captions_val2017.json  # Image Caption的标注格式

 data=json.load(open(json_file,'r'))

 #设置需要提取的图片数量 我设置提取82000张

 for i in range(82000):

     data_2 = {}

     data_2['info'] = data['info']

     data_2['licenses'] = data['licenses']

     data_2['images'] = [data['images'][i]]  # 只提取第一张图片

     data_2['categories'] = data['categories']

     annotation = []

     # 通过imgID 找到其所有对象

     imgID = data_2['images'][0]['id']

     for ann in data['annotations']:

         if ann['image_id'] == imgID:

             annotation.append(ann)

     data_2['annotations'] = annotation

     # 保存到新的JSON文件，便于查看数据特点

     #img_file 获取图片名称

     img_file=data_2['images'][0]['file_name']

     img_first=img_file.split(".")[0]

     #将提取出的图片写入data.txt文件中并换行 (optional)

     # with open('./coco_single_object/data.txt',mode='a') as f:

     #         f.write(img_file)

     #         f.write("\n")

     #设置存储目录 我的是存在当前目录下coco_single_object文件夹下 需要手动创建空文件夹

     json.dump(data_2, open('./coco_single_object/'+img_first+'.json', 'w'), indent=4)  # indent=4 更加美观显示

最后的结果是82000张 json文件

---------------------------------------------------------------------------------------------------------------------------------------

有了单张json文件之后，就是将mask掩膜提取出二值图片的过程了

注：函数传入4个参数 json_path,img_path,color_img_save,binary_img_save

分别对应 json_path: 上一步提取出的json文件的文件夹路径

img_path: coco数据集下载时原图目录

color_img_save: 存放原图的目录（需要新建此文件夹）

binary_img_save: 存放二值图的目录（需要新建此文件夹）

 from __future__ import print_function

 from pycocotools.coco import COCO

 import os, sys, zipfile

 import urllib.request

 import shutil

 import numpy as np

 import skimage.io as io

 import matplotlib.pyplot as plt

 import pylab

 pylab.rcParams['figure.figsize'] = (8.0, 10.0)

 import os

 def get_single_binaryImg(json_path,img_path,color_img_save,binary_img_save):

     # json_path json文件路径  从coco数据集的annotations标注json文件中提取出的单个json文件

     #  img_path 原图目录   下载coco数据集时的原图目录

     # color_img_save 原图存放目录

     # binary_img_save 二值图存放目录

     dir=os.listdir(json_path)

     for jfile in dir:

         annFile =os.path.join(json_path,jfile)

         coco = COCO(annFile)

         imgIds = coco.getImgIds()

         img = coco.loadImgs(imgIds[0])[0]

         dataDir = img_path

         shutil.copy(os.path.join(dataDir, img['file_name']), color_img_save)

         # load and display instance annotations

         # 加载实例掩膜

         catIds = []

         for ann in coco.dataset['annotations']:

             if ann['image_id'] == imgIds[0]:

                 catIds.append(ann['category_id'])

         annIds = coco.getAnnIds(imgIds=img['id'], catIds=catIds, iscrowd=None)

         width = img['width']

         height = img['height']

         anns = coco.loadAnns(annIds)

         mask_pic = np.zeros((height, width))

         for single in anns:

             mask_single = coco.annToMask(single)

             mask_pic += mask_single

         for row in range(height):

             for col in range(width):

                 if (mask_pic[row][col] > 0):

                     mask_pic[row][col] = 255

         imgs = np.zeros(shape=(height, width, 3), dtype=np.float32)

         imgs[:, :, 0] = mask_pic[:, :]

         imgs[:, :, 1] = mask_pic[:, :]

         imgs[:, :, 2] = mask_pic[:, :]

         imgs = imgs.astype(int)

         img_name = img['file_name'].split(".")[0]

         plt.imsave(binary_img_save + "/" + img_name + ".png", imgs)

 if __name__ == '__main__':

     json_path =r"G:\jianfeng\code\dataset\cocoapi-master\PythonAPI\get_json\test"

     img_path=r"G:\jianfeng\code\dataset\coco\train2014"

     color_img_save = r"G:\jianfeng\code\dataset\cocoapi-master\PythonAPI\get_json\color_img"

     binary_img_save = r"G:\jianfeng\code\dataset\cocoapi-master\PythonAPI\get_json\binary_img"

     get_single_binaryImg(json_path,img_path,color_img_save,binary_img_save)

最终出现这些结果：

最后在搜索得到二值图方法时，也找到了一个不错的源码，但是他是将labelme格式的json或者xml转为二值图，虽然不是将coco格式转为二值图，但是记录下也许以后也会用的到

https://github.com/samr28/labelme-to-binary-image

参考：

https://blog.csdn.net/wc781708249/article/details/79603522

https://blog.csdn.net/u013735511/article/details/79099483

coco数据集标注图转为二值图python（附代码）的更多相关文章

c语言实现灰度图转换为二值图
将上篇得到的灰度图转换为二值图,读取像素数据,低于某一值置0,否则设置为255,为得到更好的效果不同图片应采用不同的值 /* 2015年6月2日11:16:22 灰度图转换为二值图 blog:http ...
C语言实现将彩色BMP位图转化为二值图
CTF做了图片的隐写题,还没有形成系统的认识,先来总结一下BMP图的组成,并通过将彩色图转为二值图的例子加深下理解. 只写了位图二进制文件的格式和代码实现,至于诸如RGB色彩和调色板是什么的一些概念就 ...
S0.4 二值图与阈值化
目录二值图的定义二值图的应用阈值化二值化/阈值化方法 1,无脑简单判断 opencv3函数threshold()实现 2,Otsu算法(大律法或最大类间方差法) OpenCV3 纯代码实现大津 ...
用 Python 通过马尔可夫随机场（MRF）与 Ising Model 进行二值图降噪
前言这个降噪的模型来自 Christopher M. Bishop 的 Pattern Recognition And Machine Learning (就是神书 PRML……),问题是如何对一个 ...
使用OpenCV查找二值图中最大连通区域
http://blog.csdn.net/shaoxiaohu1/article/details/40272875 使用OpenCV查找二值图中最大连通区域标签: OpenCVfindCoutour ...
opencv删除二值图中较小的噪点色块
CvSeq* contour = NULL; double minarea = 100.0; double tmparea = 0.0; CFileDialog dlg(true); if (dlg. ...
zw·准专利·高保真二值图细部切分算法
zw·准专利·高保真二值图细部切分算法高保真二值图细部切分算法,是中国字体协会项目的衍生作品. 说准专利算法,是因为对于图像算法的标准不了解,虽然报过专利,但不是这方面的,需要咨询专 ...
超越OpenCV速度的MorphologyEx函数实现（特别是对于二值图，速度是CV的4倍左右）。
最近研究了一下opencv的 MorphologyEx这个函数的替代功能, 他主要的特点是支持任意形状的腐蚀膨胀,对于灰度图,速度基本和CV的一致,但是 CV没有针对二值图做特殊处理,因此,这个函数对 ...
BMP彩色转成黑色二值图
一天半把彩色bmp转成黑白了. 原理是: 第一步:读出位图数据的偏移位置:即第11个字节,用fseek即可. 然后将偏移位置之前的数据全部写入新的bmp图中. 第二步:用fseek移到位图数据这前,判 ...

随机推荐

apache httpd反向代理的用法
代理方式有三种:正向代理.透明代理和反向代理正向代理 httpd通过ProxyRequests指令配置正向代理的功能.例如: ProxyRequests On ProxyVia On <Pro ...
Java多态的总结
多态多态是一个对象具有不同表现形态或形式的能力,根据不同的实例执行不同的操作,例如打印机具有打印功能,打印机又有彩色打印机和黑白打印机,彩色打印机的实例打印出来的是彩色,黑白打印机打印出来的是黑色, ...
js正则高级函数（replace，matchAll用法），实现正则替换（实测很有效）
有这么一个文档,这是在PC端显示的效果,如果放在移动端,会发现字体大小是非常大的,那么现在想让这个字体在移动端能按照某个比例缩小,后台返回的数据格式是: <html> <head&g ...
js SetTimeout传参问题
今天写代码遇到这样一个问题,先上代码  function textout(obj){ if(opac==60){opac=0;return;}; opac+=10; ...
从Python安装到语法基础，这才是初学者都能懂的爬虫教程
Python和PyCharm的安装:学会Python和PyCharm的安装方法变量和字符串:学会使用变量和字符串的基本用法函数与控制语句:学会Python循环.判断语句.循环语句和函数的使用 Py ...
SpringBoot系列之@PropertySource用法简介
SpringBoot系列之@PropertySource用法简介继上篇博客:SpringBoot系列之@Value和@ConfigurationProperties用法对比之后,本博客继续介绍一下@ ...
聊一聊 bootstrap 的轮播图插件
今天做工作的时候,轻车熟路的做完,又用到了bootstrap的轮播图,觉得有必要安利一下这个插件,如果你需要的轮播图.功能不需要太炫酷,那么bootstrap的插件是你的首要选择. 使用方式引入js ...
RabbitMQ的交换器Exchange之direct（发布与订阅完全匹配）
1.交换器.用来接收生产者发送的消息并将这些消息路由给服务器中的队列.三种常用的交换器类型,a.direct(发布与订阅完全匹配).b.fanout(广播).c.topic(主题,规则匹配). 2. ...
MyCat启动失败 Error: Exception thrown by the agent : java.net.MalformedURLException: Local host name unknown: java.net.UnknownHostException: rebirth.a: rebirth.a: unknown error
在使用Nactive连接MyCat的时候发现怎么连接都不ok,明明已经启动了(实际上启动失败了)! 粗心的我,后来看了下日志,果然,启动失败了 Error: Exception thrown by t ...
VS2017安装使用Easyx时出现的问题及解决方法
EasyX 是针对 Visual C++ 的绘图库,在初学 C 语言实现图形和游戏编程.图形学.分形学等需要绘图实践的领域有一定应用. EasyX 库在 Visual C++ 中模拟了 Turbo C ...

coco数据集标注图转为二值图python（附代码）

coco数据集标注图转为二值图python（附代码）的更多相关文章

随机推荐

热门专题