Faster Rcnn训练自己的数据集过程大白话记录
声明:每人都有自己的理解,动手实践才能对细节更加理解!
参考:https://www.cnblogs.com/darkknightzh/p/10043864.html
一.算法理解
此处省略一万字。。。。。。。。。。。。。。。。。。
二.训练及源码理解
首先配置:
在./lib/utils文件下....运行
python setup.py build_ext --inplace
python setup.py build_ext install
Go to ./lib/utils文件夹下...运行
python setup.py build_ext --inplace
- 数据介绍:检测图片当中的手写体区域,图片不多自己标注了大约800张,但是图片中的手写体区域大约几千个,之前训练CTPN自己制作的数据集。
- 数据格式:分为3个文件夹,首先是JPEGImages(存放的训练图片,命名格式:000000.png,000001.png...等),然后是ImageSets(里面分Layout(包括test.txt,train.txt,trainval.txt,val.txt,存放训练测试验证的文件名称)和Main即可),另外Annotations(存放的是标注数据,xml格式的,之前数据标注在txt里面,自己转为xml标标准格式存储,或者用labelImg-master(Windows)标注,直接生成xml即可),至此数据准备完毕。。。。。。。
- 模型准备:默认前段卷积网络VGG16,vgg16需要自己下载,存放在路径.data/imagenet_weights/vgg16.ckpt
- 训练:train.py,主要流程及核心代码如下
net.create_architecture(sess, "TRAIN", self.imdb.num_classes, tag='default')
rois, cls_prob, bbox_pred = self.build_network(sess, training) rois为roi pooling层得到的框,cls_prob分类得分,bbox_pred框预测
net = self.build_head(is_training) vgg16卷积层提取特征,图片缩小16倍
rpn_cls_prob, rpn_bbox_pred, rpn_cls_score, rpn_cls_score_reshape = self.build_rpn(net, is_training, initializer) rpn网络(anchor生成与原图对应坐标),分类得分,候选框偏移等
rois = self.build_proposals(is_training, rpn_cls_prob, rpn_bbox_pred, rpn_cls_score) 通过超出图片区域,nms等筛选出合适的rois
cls_score, cls_prob, bbox_pred = self.build_predictions(net, rois, is_training, initializer, initializer_bbox) roi pooling,全连接预测等
- 训练自己数据修改的地方,手写体识别就设置了一个类别:chinese,在源码pascal_voc.py中修改self._classes=('__background__', 'chinese')可以按照自己的类别进行修改,注意图片后缀格式,然后修改各种路径就可以训练了。
- 测试:迭代了10000次,用demo代码进行测试,数据较少,训练次数也不多,效果还可以,注意修改CLASSES = ('__background__', 'chinese') 预测结果如图所示:

Faster Rcnn训练自己的数据集过程大白话记录的更多相关文章
- CTPN训练自己的数据集过程大白话记录
一.算法理解 此处省略1万字.............. 二.训练及源码理解 配置以下3步: 在utils文件夹和utils\bbox文件夹下创建__init__.py文件 在utils\bbox文件 ...
- faster rcnn训练自己的数据集
采用Pascal VOC数据集的组织结构,来构建自己的数据集,这种方法是faster rcnn最便捷的训练方式
- 如何才能将Faster R-CNN训练起来?
如何才能将Faster R-CNN训练起来? 首先进入 Faster RCNN 的官网啦,即:https://github.com/rbgirshick/py-faster-rcnn#installa ...
- caffe学习三:使用Faster RCNN训练自己的数据
本文假设你已经完成了安装,并可以运行demo.py 不会安装且用PASCAL VOC数据集的请看另来两篇博客. caffe学习一:ubuntu16.04下跑Faster R-CNN demo (基于c ...
- python3 + Tensorflow + Faster R-CNN训练自己的数据
之前实现过faster rcnn, 但是因为各种原因,有需要实现一次,而且发现许多博客都不全面.现在发现了一个比较全面的博客.自己根据这篇博客实现的也比较顺利.在此记录一下(照搬). 原博客:http ...
- Fast RCNN 训练自己的数据集(3训练和检测)
转载请注明出处,楼燚(yì)航的blog,http://www.cnblogs.com/louyihang-loves-baiyan/ https://github.com/YihangLou/fas ...
- faster rcnn训练详解
http://blog.csdn.net/zy1034092330/article/details/62044941 py-faster-rcnn训练自己的数据:流程很详细并附代码 https://h ...
- Fast R-CNN训练自己的数据集时遇到的报错及解决方案
最近使用Fast R-CNN训练了实验室的数据集,期间遇到一些报错,主要还是在配置环境上比较麻烦,但可以根据提示在网上找到解决这些错误的办法.这里我只记录一些难改的报错,以后再遇见这些时希望能尽快解决 ...
- faster rcnn训练过程讲解
http://blog.csdn.net/u014696921/article/details/60321425
随机推荐
- hdu 4146 Flip Game
Flip Game Time Limit: 15000/5000 MS (Java/Others) Memory Limit: 65535/32768 K (Java/Others)Total ...
- Python--day24--多继承
如果本生没有func方法的话就调用距离自己最近的基类的方法 钻石继承: 查找方法的顺序:如下例的找func方法(广度优先) 例1: 例2: 漏斗继承: 小乌龟继承问题:(最顶端的节点F是最后查找的) ...
- win10 uwp release 因为 Entry Point Not Found 无法启动
本文告诉大家如果在使用 release 编译时,无法启动应用,出现 Entry Point Not Found 如何让应用运行. 程序"[30760] xx.exe"已退出,返回值 ...
- java 声明多个泛型类型和通配符
若一个类中多个字段需要不同的泛型声明,则在声明类的时候指定多个泛型类型即可: 格式: public interface IDAO<PK, T> { PK add(T t); void re ...
- Nodejs模拟并发,尝试的两种解决方案
一.准备数据库表 创建商品库存表 db_stock ,插入一条数据 DROP TABLE IF EXISTS `db_stock`; CREATE TABLE `db_stock` ( `id` ) ...
- AS优化
第一步:打开AS安装所在的位置,用记事本打开“红色框”选中的文件. 如图: 第二步:打开“studio64.exe.vmoptions”文件后修改里面的值,修改后如下: 1 2 3 4 5 6 7 8 ...
- Struts2 注释类型
Struts 2 应用程序可以使用Java5注释作为替代XML和Java属性配置.这里是清单的不同的类别有关的最重要的注解: 命名空间注释(动作注释): @ Namespace注释允许在Action类 ...
- [reviewcode] 那些基础comments
多次提醒我,为变量取个合适的名字, so cute person: Not a big deal, but try using variable names better than my_sa 每个参 ...
- 赋值、关系、逻辑运算、if、switch case
cout << boolalpha将打印输出0转为false,1转为true 逻辑运算符: &&(与) 且 两个条件为真时结果为真 ||(或) 或 两个 ...
- Spark RDD的弹性到底指什么
RDD(Resiliennt Distributed Datasets)抽象弹性分布式数据集对于Spark来说的弹性计算到底提现在什么地方? 自动进行内存和磁盘数据这两种存储方式的切换 Spark 可 ...