搞图像深度学习的童鞋一定碰过图像数据标注的东西,当我们训练网络时需要训练集数据,但在网上又没有找到自己想要的数据集,这时候就考虑自己制作自己的数据集了,这时就需要对图像进行标注。图像标注是件很枯燥又很费人力物力的一件事情,但是又不能回避,毕竟搞深度学习如果没有数据集那一切都是瞎搞。最近我在参加一个有关图像深度学习的比赛,因为命题方没有给出训练集,所以需要队伍自己去标注训练集,所以我花点时间开发了一些图像标注小工具给我的团队使用,以减轻标注的难度,加快标注的速度。

这篇文章我将分享三个标注小工具,分别用于图像分类、目标检测以及语义分割的图像标注任务。

图像分类标注小工具

实现图像分类的小工具太好开发了,因为它功能很简单,无非是对一个文件夹内的所有图片进行分类,生成每张图片所对应的类别标签,用txt文件存储起来,当然也可以把每一类图片放在对应的该类的文件夹下。

我实现的这个图像分类小工具的功能就是,循环弹出一个文件夹内所有的图片,标注人员对这张图片进行分类,属于1类就按1,属于2类就按2,如此类推,按完相应号码后图片自动跳到下一张,直至文件夹内的图片都被标注完毕。

我们以下面的图库为例,将其分为3类。

首先我们需要创建相应的文件夹来存储每个类的图片

图像分类标注小工具代码:

#include "opencv2/imgproc.hpp"
#include "opencv2/highgui.hpp"
#include <iostream> #define DATA_DIR ".\\dataset\\"
#define IMG_MAX_NUM 20 using namespace cv;
using namespace std; int main()
{
FILE* fp;
FILE* fp_result;
fp = fopen("start.txt", "r"); //读取开始的图片名字,方便从某一图片开始标注
int start_i = 0;
fscanf(fp, "%d", &start_i);
fclose(fp); fp_result = fopen("classify_record.txt", "a+"); //用于记录每张图每个框的标注信息 printf("start_i: %d\n", start_i); /*循环读取图片来标注*/
for (int i = start_i; i < IMG_MAX_NUM; i++)
{
stringstream ss1,ss2,ss3; ss1 << DATA_DIR <<"data\\"<< i << ".jpg";
ss3 << i << ".jpg";
Mat src = imread(ss1.str());
if (src.empty())
{
continue;
}
printf("正在操作的图像: %s\n", string(ss1.str()).c_str()); imshow("标注", src); char c = 0;
c = waitKey(0);
while ( c != '1' && c != '2' && c != '3')
{
c = waitKey(0);
printf("invaid input!\n");
} ss2 << DATA_DIR << c << "\\" << i << ".jpg"; char type = c - '0';
printf("分类为: %d\n", c - '0');
imwrite(ss2.str(), src); //copy一份到对应类别的文件夹
fprintf(fp_result, "%s %d\n", string(ss3.str()).c_str(), type);
} fclose(fp_result);
return 0;
}

利用工具进行标注

每一类图片被分到相应的文件夹内

同时也生成标签文件,每行以图片路径+对应的类别的方式呈现。

目标检测图像标注小工具

在目标检测相关的网络训练中,我们需要有带有以下标签的数据集:

我们做标注时不仅仅要把我们想要识别的物体用矩形框将其框出来,还需要记录这个框的相关信息,比如这个框的左顶点坐标、宽度高度等(x,y,w,h)。为了能实现这个标注任务,这个标注小工具必须具备框图和自动记录(x,y,w,h)信息的功能。

利用opencv我们可以快速实现用矩形框框出对应物体的功能,再加上将每个矩形框的信息有序记录在txt文件的功能,一个用于检测图像标注小工具就算开发好了。

目标检测图像标注小工具代码:

#include "opencv2/imgproc.hpp"
#include "opencv2/highgui.hpp"
#include <iostream> #define DATA_DIR ".\\cut256\\"
#define IM_ROWS 5106
#define IM_COLS 15106
#define ROI_SIZE 256 using namespace cv;
using namespace std; Point ptL, ptR; //鼠标画出矩形框的起点和终点,矩形的左下角和右下角
Mat imageSource, imageSourceCopy;
FILE* fp_result; struct UserData
{
Mat src;
vector<Rect> rect;
}; void OnMouse(int event, int x, int y, int flag, void *dp)
{
UserData *d = (UserData *)dp;
imageSourceCopy = imageSource.clone(); if (event == CV_EVENT_LBUTTONDOWN) //按下鼠标右键,即拖动开始
{
ptL = Point(x, y);
ptR = Point(x, y);
}
if (flag == CV_EVENT_FLAG_LBUTTON) //拖拽鼠标右键,即拖动进行
{
ptR = Point(x, y);
imageSourceCopy = imageSource.clone();
rectangle(imageSourceCopy, ptL, ptR, Scalar(0, 255, 0));
imshow("标注", imageSourceCopy); }
if (event == CV_EVENT_LBUTTONUP) //拖动结束
{
if (ptL != ptR)
{
rectangle(imageSourceCopy, ptL, ptR, Scalar(0, 255, 0));
imshow("标注", imageSourceCopy); int h = ptR.y - ptL.y;
int w = ptR.x - ptL.x; printf("选择的信息区域是:x:%d y:%d w:%d h:%d\n", ptL.x, ptL.y, w, h); d->rect.push_back(Rect(ptL.x, ptL.y, w, h));
//d->src(imageSourceCopy);
}
} //点击右键删除一个矩形
if (event == CV_EVENT_RBUTTONDOWN)
{
if (d->rect.size() > 0)
{
Rect temp = d->rect.back(); printf("删除的信息区域是:x:%d y:%d w:%d h:%d\n", temp.x, temp.y, temp.width, temp.height);
d->rect.pop_back(); for (int i = 0; i < d->rect.size(); i++)
{
rectangle(imageSourceCopy, d->rect[i], Scalar(0, 255, 0), 1);
} }
} } void DrawArea(Mat& src, string img_name, string path_name)
{
Mat img = src.clone();
char c = 'x';
UserData d;
d.src = img.clone();
while (c != 'n')
{
Mat backup = src.clone();
imageSource = img.clone(); namedWindow("标注", 1);
imshow("标注", imageSource);
setMouseCallback("标注", OnMouse, &d); c = waitKey(0); if (c == 'a')
{
printf("rect size: %d\n", d.rect.size());
for (int i = 0; i < d.rect.size(); i++)
{
rectangle(backup, d.rect[i], Scalar(0, 255, 0), 1);
} img = backup.clone(); }
} fprintf(fp_result, "%s\n", img_name.c_str());
fprintf(fp_result, "%d\n", d.rect.size());
for (int i = 0; i < d.rect.size(); i++)
{
Rect t = d.rect[i]; fprintf(fp_result, "%d %d %d %d\n", t.x, t.y, t.width, t.height);
} imwrite(path_name, img); }
int main()
{
FILE* fp;
fp = fopen("start.txt", "r");
int start_i = 0;
int start_j = 0;
fscanf(fp, "%d %d", &start_i, &start_j);
fclose(fp); fp_result = fopen("record.txt", "a+"); printf("start_i: %d, start_j: %d\n", start_i, start_j); /*循环读取图片来标注*/
for (int i = start_i; i< IM_ROWS / ROI_SIZE + 1; i++)
{
for (int j = start_j; j<IM_COLS / ROI_SIZE; j++)
{
stringstream ss1, ss2; ss1 << DATA_DIR << "2017\\" << i << "_" << j << "_" << ROI_SIZE << "_.jpg";
ss2 << DATA_DIR << "label_img\\" << i << "_" << j << "_" << ROI_SIZE << "_.jpg";
cout << ss1.str() << endl;
string str(ss1.str());
string str2(ss2.str());
cv::Mat src = cv::imread(ss1.str()); DrawArea(src, str,str2); } }
fclose(fp_result);
return 0;
}

以标注建筑物为例子吧!

然后在txt文件中可以看到我们标记的矩形信息记录,第一行是图片路径+框的个数,第二行开始是每个矩形的x,y,w,h。

语义分割图像标注小工具

语义分割的标注相比上面的标注要复杂得多,所以标注工具开发起来也略难一点。

比如有这么一个任务,我们需要把图像中的建筑物给标注出来,生成一个mask图。

比如这样子

然后我们以后就可以根据这些mask图作为label来进行语义分割网络的训练了。

实现这么一个工具还是不算太复杂,主要功能的实现就在于使用了opencv的多边形的生成与填充函数。标注人员只需要在要标注的物体边缘打点,然后工具就会自动填充该区域,进而生成黑白mask图。

#include <iostream>
#include <sstream>
#include <vector>
#include <opencv2/opencv.hpp>
using namespace std; #define DATA_DIR ".\\cut256\\" #define IM_ROWS 5106
#define IM_COLS 15106
#define ROI_SIZE 256
struct UserData
{
cv::Mat src;
vector<cv::Point> pts;
}; FILE* fpts_set; void on_mouse(int event, int x, int y, int flags, void *dp)
{
UserData *d = (UserData *)dp;
if (event == CV_EVENT_LBUTTONDOWN)
{
d->pts.push_back(cv::Point(x, y));
}
if (event == CV_EVENT_RBUTTONDOWN)
{
if (d->pts.size()>0)
d->pts.pop_back();
}
cv::Mat temp = d->src.clone();
if (d->pts.size()>2)
{
const cv::Point* ppt[1] = { &d->pts[0] };
int npt[] = { static_cast<int>(d->pts.size()) };
cv::fillPoly(temp, ppt, npt, 1, cv::Scalar(0, 0, 255), 16); }
for (int i = 0; i<d->pts.size(); i++)
{
cv::circle(temp, d->pts[i], 1, cv::Scalar(0, 0, 255), 1, 16);
}
cv::circle(temp, cv::Point(x, y), 1, cv::Scalar(0, 255, 0), 1, 16);
cv::imshow("2017", temp); } void WriteTxT(vector<cv::Point>& pst)
{
for (int i = 0; i < pst.size(); i++)
{
fprintf(fpts_set, "%d %d", pst[i].x, pst[i].y);
if (i == pst.size() - 1)
{
fprintf(fpts_set, "\n");
}
else
{
fprintf(fpts_set, " ");
}
}
} int label_img(cv::Mat &src, cv::Mat &mask, string& name)
{
char c = 'x'; vector<vector<cv::Point> > poly_point_set; while (c != 'n')
{
UserData d;
d.src = src.clone(); cv::namedWindow("2017", 1);
cv::setMouseCallback("2017", on_mouse, &d);
cv::imshow("2017", src);
c = cv::waitKey(0);
if (c == 'a')
{
if (d.pts.size()>0)
{
const cv::Point* ppt[1] = { &d.pts[0] };
int npt[] = { static_cast<int>(d.pts.size()) };
cv::fillPoly(src, ppt, npt, 1, cv::Scalar(0, 0, 255), 16);
cv::fillPoly(mask, ppt, npt, 1, cv::Scalar(255), 16);
poly_point_set.push_back(d.pts);
} }
} fprintf(stdout, "%s %d\n", name.c_str(), poly_point_set.size());
fprintf(fpts_set, "%s %d\n", name.c_str(), poly_point_set.size()); //将点集写入文件
for (int i = 0; i < poly_point_set.size(); i++)
{
WriteTxT(poly_point_set[i]);
} return 0;
}
int main()
{
FILE* fp;
fp = fopen("start.txt", "r");
int start_i = 0;
int start_j = 0;
fscanf(fp, "%d %d", &start_i, &start_j);
fclose(fp); fpts_set = fopen("semantic_label.txt", "a+"); printf("start_i: %d, start_j: %d\n", start_i, start_j); for (int i = start_i; i<IM_ROWS / ROI_SIZE + 1; i++)
{
for (int j = start_j; j<IM_COLS / ROI_SIZE; j++)
{
stringstream ss1,ss2,ss3;
cv::Mat mask(256, 256, CV_8UC1);
mask.setTo(0); ss1 << DATA_DIR << "2017\\" << i << "_" << j << "_" << ROI_SIZE << "_.jpg";
ss2 << DATA_DIR << "label\\" << i << "_" << j << "_" << ROI_SIZE << "_.jpg";
ss3 << i << "_" << j << "_" << ROI_SIZE << "_.jpg";
cout << ss1.str() << endl; cv::Mat src = cv::imread(ss1.str()); label_img(src, mask, string(ss3.str()));// label based on tiny
cv::imwrite(ss2.str(), mask);
} } fclose(fpts_set);
return 0;
}

所以我们可以利用这个标注工具对任意形状的物体进行标注,原理就是利用多边形的逼近。看看效果吧

生成的mask图

当然我们也可以根据需求把每个标注的每个图形的边缘点记录下来

希望这三款小工具能给你带来一点小帮助和小启发~

OpenCV探索之路(二十五):制作简易的图像标注小工具的更多相关文章

  1. OpenCV探索之路(十五):角点检测

    角点检测是计算机视觉系统中用来获取图像特征的一种方法.我们都常说,这幅图像很有特点,但是一问他到底有哪些特点,或者这幅图有哪些特征可以让你一下子就识别出该物体,你可能就说不出来了.其实说图像的特征,你 ...

  2. Bootstrap <基础二十五>警告(Alerts)

    警告(Alerts)以及 Bootstrap 所提供的用于警告的 class.警告(Alerts)向用户提供了一种定义消息样式的方式.它们为典型的用户操作提供了上下文信息反馈. 您可以为警告框添加一个 ...

  3. VMware vSphere 服务器虚拟化之二十五 桌面虚拟化之终端服务池

    VMware vSphere 服务器虚拟化之二十五 桌面虚拟化之终端服务池 终端服务池是指由一台或多台微软终端服务器提供服务的桌面源组成的池.终端服务器桌面源可交付多个桌面.它具有以下特征: 1.终端 ...

  4. WCF技术剖析之二十五: 元数据(Metadata)架构体系全景展现[元数据描述篇]

    原文:WCF技术剖析之二十五: 元数据(Metadata)架构体系全景展现[元数据描述篇] 在[WS标准篇]中我花了很大的篇幅介绍了WS-MEX以及与它相关的WS规范:WS-Policy.WS-Tra ...

  5. Bootstrap入门(二十五)JS插件2:过渡效果

    Bootstrap入门(二十五)JS插件2:过渡效果 对于简单的过渡效果,只需将 transition.js 和其它 JS 文件一起引入即可.如果你使用的是编译(或压缩)版的bootstrap.js  ...

  6. JAVA基础再回首(二十五)——Lock锁的使用、死锁问题、多线程生产者和消费者、线程池、匿名内部类使用多线程、定时器、面试题

    JAVA基础再回首(二十五)--Lock锁的使用.死锁问题.多线程生产者和消费者.线程池.匿名内部类使用多线程.定时器.面试题 版权声明:转载必须注明本文转自程序猿杜鹏程的博客:http://blog ...

  7. JAVA之旅(二十五)——文件复制,字符流的缓冲区,BufferedWriter,BufferedReader,通过缓冲区复制文件,readLine工作原理,自定义readLine

    JAVA之旅(二十五)--文件复制,字符流的缓冲区,BufferedWriter,BufferedReader,通过缓冲区复制文件,readLine工作原理,自定义readLine 我们继续IO上个篇 ...

  8. Java进阶(二十五)Java连接mysql数据库(底层实现)

    Java进阶(二十五)Java连接mysql数据库(底层实现) 前言 很长时间没有系统的使用java做项目了.现在需要使用java完成一个实验,其中涉及到java连接数据库.让自己来写,记忆中已无从搜 ...

  9. 策略模式 Strategy 政策Policy 行为型 设计模式(二十五)

    策略模式 Strategy   与策略相关的常见词汇有:营销策略.折扣策略.教学策略.记忆策略.学习策略.... “策略”意味着分情况讨论,而不是一概而论 面对不同年龄段的人,面对不同的商品,必然将会 ...

随机推荐

  1. 写给后端的前端笔记:浮动(float)布局

    写给后端的前端笔记:浮动(float)布局 这篇文章主要面向后端人员,对前端有深刻了解的各位不喜勿喷. 起因 前一阵子我一个后端的伙伴问我,"前端的左飘怎么做?",我立马就懵了,& ...

  2. CentOS7.3虚拟机扩展数据磁盘

    操作之前需要重点查看: 由于扩容磁盘的操作非同小可,一旦哪一步出现问题,就会导致分区损坏,数据丢失等一系列严重的问题,因此建议:在进行虚拟机分区扩容之前,一定要备份重要数据文件,并且先在测试机上验证以 ...

  3. SVG坐标系统及图形变换

    前面的话 前面介绍过SVG视野后,本文将开始介绍SVG坐标系统及图形变换 坐标定位 对于所有元素,SVG使用的坐标系统或者说网格系统,和Canvas用的差不多(所有计算机绘图都差不多).这种坐标系统是 ...

  4. 移动端iOS阻止橡皮筋效果

    一.遇到的问题 移动端开发中,iOS的微信浏览器也好.Safari也好在浏览网页的时候会出现橡皮筋效果.就是当页面拉到尽头的时候还能再继续拉动,露出浏览器的底色,松手会回弹回去. 微信浏览器: Saf ...

  5. JavaScript在应用中的技巧(一)

    分享一些在JavaScript中遇到的一些实用的技巧. 理解JavaScript的数值型数据类型 JavaScript的数值型数据类型只有一种:number.即不管是整数还是浮点数,JavaScrip ...

  6. CPU和GPU的差别

    详见:http://blog.yemou.net/article/query/info/tytfjhfascvhzxcyt317 首先需要解释CPU和GPU这两个缩写分别代表什么.CPU即中央处理器, ...

  7. Google的SPDY协议成为HTTP 2.0的基础

    详见:http://blog.yemou.net/article/query/info/tytfjhfascvhzxcyt384 据TNW援引 IFTF HTTP 工作组主席 Mark Notting ...

  8. java枚举类型构造方法为什么是private的

    枚举类型是单例模式的.你需要实例化一次,然后再整个程序之中就可以调用他的方法和成员变量了.枚举类型使用单例模式是因为他的值是固定的,不需要发生改变.更多知识见 http://blog.yemou.ne ...

  9. Mock Server 入门

    Mock Server介绍 什么是mock ? 我在去年的时候介绍一篇幅 python mock的基本使用,http://www.cnblogs.com/fnng/p/5648247.html 主要是 ...

  10. express传输buffer文件

    最近要做一个功能,导出动态生成的excel文件,这个普普通通的功能却让我折腾了半天.大致流程是这样的,将数据结合excel模板通过ejsExcel库,动态生成excel文件,并发送到客户端. 在exp ...