Keras-RetinaNet

在自标数据集 alidq 上训练 detection model RetinaNet

模型部署与环境配置

数据预处理

数据统计信息：

类别：gun1, gun2

有效数据量：23216

测试集大小：1000

训练验证集大小：22216

由于此次 detection 任务比较简单，为了实验 fine tuning 对模型的影响，我们将训练数据分为 3 个部分，实验在第 1 部分数据上完成。

Part 1 训练数据统计量：

gun1 数量：2826

gun2 数量：3170

预处理需要将标注数据文件格式转换为固定格式的 csv 文件，schema 为：

path/to/imagefile,xmin,ymin,xmax,ymax,classname
我们标注的 Raw data 中包含的信息量是足够的，但需要一些针对模型的数据格式调整；
除了 Bounding Box 的坐标和类别名，我们还需要定义类别名到类别ID 映射（class name to class ID mapping），ID 从 0 开始。在这次的例子里很简单，在数据集目录新建一个 csv 文件，其内容为：

gun1,0

gun2,1
需要提出的一点是：如果没有特殊要求，我们交付的数据中，Bounding Box 的坐标最好按照普遍通用的顺序处理好，即xmin,ymin,xmax,ymax；
预处理完成后，可以使用 keras-retinanet 中的调试工具 debug.py 检查 csv 是否有效且观察标注框在图中的效果：

$ python keras-retinanet/bin/debug.py csv

/path/to/annotations /path/to/class_label_mapping

或

$ retinanet-debug csv /path/to/annotations /path/to/class_label_mapping

注：无效标注的框呈红色，有效标注为绿色。

训练

下载在 coco 数据集上训练好的模型 resnet50_coco_best_v2.1.0.h5 到snapshot/

数据准备完成且确认无误后就可以开始训练了。

此次训练起点是预训练过的 resnet50_coco_best_v2.1.0.h5，steps=6000，epochs=5，在 K80 显卡训练的时间大概是 5-6 小时。

$ python keras-retinanet/bin/train.py --weights snapshots/resnet50_coco_best_v2.1.0.h5 --steps 6000 --epochs 5 --gpu 0 csv /path/to/annotations /path/to/class_label_mapping

$ retinanet-train --weights snapshots/resnet50_coco_best_v2.1.0.h5 --steps 6000 --epochs 5 --gpu 0 csv /path/to/annotations /path/to/class_label_mapping

评价

训练完成后，我们需要用 1000 条测试数据对模型的 performance 做出评价。我在准备评价数据时，发现标注数据（我们标注的 Ground Truth）存在大约 5% 的错误分类。这些错误分类是我通过人工辨识 model 预测的结果与 GT 的差别而得到的。也就是说，刚刚训练好的 model 帮助我找到了很多标注数据的错误标注！

虽然这些错误标注在训练的时候不会产生太大影响（否则也不会帮我找错），但在做评价时会严重影响模型的 performance。可能需要借助刚训练好的 model 对 1000 个测试数据做清洗。

Written with StackEdit.

RetinaNet 迁移学习到自标数据集的更多相关文章

【47】迁移学习（Transfer Learning）
迁移学习(Transfer Learning) 如果你要做一个计算机视觉的应用,相比于从头训练权重,或者说从随机初始化权重开始,如果你下载别人已经训练好网络结构的权重,你通常能够进展的相当快,用这个作 ...
NASNet学习笔记—— 核心一：延续NAS论文的核心机制使得能够自动产生网络结构；核心二：采用resnet和Inception重复使用block结构思想；核心三：利用迁移学习将生成的网络迁移到大数据集上提出一个new search space。
from:https://blog.csdn.net/xjz18298268521/article/details/79079008 NASNet总结论文:<Learning Transfer ...
基于深度学习和迁移学习的识花实践——利用 VGG16 的深度网络结构中的五轮卷积网络层和池化层，对每张图片得到一个 4096 维的特征向量，然后我们直接用这个特征向量替代原来的图片，再加若干层全连接的神经网络，对花朵数据集进行训练（属于模型迁移）
基于深度学习和迁移学习的识花实践(转) 深度学习是人工智能领域近年来最火热的话题之一,但是对于个人来说,以往想要玩转深度学习除了要具备高超的编程技巧,还需要有海量的数据和强劲的硬件.不过 Tens ...
PyTorch迁移学习-私人数据集上的蚂蚁蜜蜂分类
迁移学习的两个主要场景微调CNN:使用预训练的网络来初始化自己的网络,而不是随机初始化,然后训练即可将CNN看成固定的特征提取器:固定前面的层,重写最后的全连接层,只有这个新的层会被训练下面修改 ...
使用deeplabv3+训练自己数据集（迁移学习）
概述在前边一篇文章,我们讲了如何复现论文代码,使用pascal voc 2012数据集进行训练和验证,具体内容可以参考<deeplab v3+在pascal_voc 2012数据集上进行训练& ...
《A Survey on Transfer Learning》迁移学习研究综述翻译
迁移学习研究综述 Sinno Jialin Pan and Qiang Yang,Fellow, IEEE 摘要: 在许多机器学习和数据挖掘算法中,一个重要的假设就是目前的训练数据和将来的训练数据 ...
迁移学习-Transfer Learning
迁移学习两种类型: ConvNet as fixed feature extractor:利用在大数据集(如ImageNet)上预训练过的ConvNet(如AlexNet,VGGNet),移除最后几层 ...
[DeeplearningAI笔记]ML strategy_2_3迁移学习/多任务学习
机器学习策略-多任务学习 Learninig from multiple tasks 觉得有用的话,欢迎一起讨论相互学习~Follow Me 2.7 迁移学习 Transfer Learninig 神 ...
Gluon炼丹（Kaggle 120种狗分类，迁移学习加双模型融合）
这是在kaggle上的一个练习比赛,使用的是ImageNet数据集的子集. 注意,mxnet版本要高于0.12.1b2017112. 下载数据集. train.zip test.zip labels ...

随机推荐

分享cropper剪切单张图片demo
<!DOCTYPE html> <html lang="zh-cn"> <head> <meta charset="UTF-8& ...
关于换行这个动作，win 和 mac 的实现
‘\r'是回车,前者使光标到行首,(carriage return)'\n'是换行,后者使光标下移一格,(line feed) \r 是回车,return\n 是换行,newline 对于换行这个动作 ...
查询表空间及已使用情況的SQL语句
语句一: select f.tablespace_name tablespace_name, round((d.sumbytes / 1024 / 1024 / 1024), 2) total_g, ...
纯javascript实现选择框的全选与反选
HTML部分 <div id="wrap_input_box" > <input type="checkbox"><br> ...
code#5 P3 我有矩阵，你有吗？
我有矩阵,你有吗? 时间限制: 1.0 秒空间限制: 128 MB 相关文件: 题目目录题目描述企鹅豆豆手里有两个 01 矩阵 A 和 B.他可以进行两种操作: 选择 A 矩阵的一行,然后把 ...
source .bashrc 报错：virtualenvwrapper.sh: There was a problem running the initialization hooks.
在Ubuntu下安装完virtualenv.virtualenvwrapper,然后设置环境文件 .bashrc 接着 source .bashrc,产生错误信息首先确认了 libpam-mount ...
ElasticSearch优化系列三：机器设置（内存）
heap参数设置优化命令行修改 ./bin/elasticsearch -Xmx10g -Xms10g xmx-JVM最大允许分配的堆内存,按需分配 xms-JVM初始分配的堆内存此值设置与-Xm ...
Docker部署大型互联网电商平台
1.Docker简介 1.1虚拟化 1.1.1什么是虚拟化在计算机中,虚拟化(英语:Virtualization)是一种资源管理技术,是将计算机的各种实体资源,如服务器.网络.内存及存储等,予以抽象 ...
每天一个Linux命令之less
之前一下子看过好多Linux命令,当初记得但是一直没有使用就忘了,现在仿这别人写一下争取能记得时间久一点233333 我使用的是ubuntu Less 这是一个查看文件的命令进行翻页的命令有一下几个 ...
DMZ靶场渗透
0x00 目标站点www.test.ichunqiu 0x01 尝试登陆系统 -尝试弱密码登陆结果:forbidden!!! -尝试万能账号密码登陆 1‘ or 1=1--+ 和 1‘ or 1=1 ...

RetinaNet 迁移学习到自标数据集

Keras-RetinaNet

模型部署与环境配置

数据预处理

训练

评价

RetinaNet 迁移学习到自标数据集的更多相关文章

随机推荐

热门专题