frcnn_train_data_param frcnn_train_data_param { source: "./data/train_list.txt" root_folder: "./data/train_images" num_classes: ignore_label: distort_param { brightness_prob: 0.5 brightness_delta: contrast_prob: 0.5 contrast_lower: 0.5…
一. 算法概述 本文提出的SSD算法是一种直接预测目标类别和bounding box的多目标检测算法.与faster rcnn相比,该算法没有生成 proposal 的过程,这就极大提高了检测速度.针对不同大小的目标检测,传统的做法是先将图像转换成不同大小(图像金字塔),然后分别检测,最后将结果综合起来(NMS).而SSD算法则利用不同卷积层的 feature map 进行综合也能达到同样的效果.文章的核心之一是同时采用lower和upper的feature map做检测.          …
今天测试时间报错,具体如下图: 在网上查了一下,大概的原因是由于程序中使用了随机函数造成的,后来检查了一下prototxt中有可能含有随机数的地方,去掉之后就可以了,包括shuffle:true,以及distort_param两个,把它们去掉就可以了,反正不影响时间测试.…
refinedet只预测4个层,并且只有conv6_1.conv6_2,没有ssd中的conv7.8.9 refinedet的4个层都只有1个aspect ratio和1个min_size,所以每层每个点只有3个anchor,arm中做location的conv4_3_norm_mbox_loc等层都是3*4个channel,做confidence的conv4_3_norm_mbox_conf都是6个channel,因为这里变成了2分类,每个anchor必须要有negative和positive…
原文:http://blog.csdn.net/a8039974/article/details/77592395, http://blog.csdn.net/jesse_mx/article/details/74011886 另外一篇很详细的解析:https://www.cnblogs.com/xuanyuyt/p/7222867.html SSD github : https://github.com/weiliu89/caffe/tree/ssd SSD paper : https://a…
这是在frcnn_data_layer的操作,即读图片的操作 if (param.gaussian_noise()) { CHECK(img.type() == CV_8UC3) << "gaussian_noise() needs RGB image."; int mu = param.mu(); int sigma = caffe_rng_rand() % param.sigma(); cv::Mat gaussian_noise(img.size(), img.typ…
数据输入方面:1.image pyramid 图像金字塔.目前代码里是先选取一个scale,然后在每个GPU上按照scale读图片,相应的gt也更改."scales":[440, 520, 600, 680, 760] 使用的是短边的缩放到的尺寸,还用个maxsize限制了你的scale必须小于一个值 wk的代码和原本的sensenet很大不一样,重新看,好像加了很多trick deformable convolution是同时训练多个scale,然后每个网络训练出来的乘以一个权重 但…
训练方式::https://blog.csdn.net/xiao_lxl/article/details/79106837 caffe-ssd训练自己的数据集 https://blog.csdn.net/lukaslong/article/details/81509855 错误:: SSD(Single Shot MultiBox Detector):create_list.sh io.cpp:187 Could not open or find file https://blog.csdn.n…