YOLO v1之总结篇（linux+windows）

　　YOLO出自2016 CVPR You Only Look Once:Unified, Real-Time Object Detection，也是一个非常值得学习的框架，不得不说facebook的技术就是牛啊。
　　
　　整个训练和检测框架都是端到端，YOLO达到了45帧每秒，Fast YOLO达到了155帧每秒，除了刚开始加载模型有点慢，检测部分确实是非常的快。
　　
　　整个检测过程分为3个阶段，（1）将图像缩放到448*448（2）通过神经网格进行检测和分类（3）NMS抑制，输出最终结果该模型首先，将输入的图像分为S*S个grid，然后每个grid产生B个预测边界框（包括，x,y,windth,height,confidence）和C类判别属性，最终将输出S*S*(B*5+C)维度的向量。
　　
　　在VOC上训练中，S=7，B=2，C=20，最终输出7*7*（2*5+20）维度的信息。
　　
　　YOLO包含24个卷基层，2个全连接层，FastYOLO只包含9个卷基层，因此速度快很多，当然代价就是精度也相应的有损失。
　　
　　YOLO的损失函数，权衡了边界框的损失和类别判断的损失，使得边界框的损失是类别判断损失的10倍，同时兼顾了大的边界框和小的边界框的IOU偏差，使得同样的损失在大框中表现出很小的影响，小框中则变现出很大的影响。
　　
　　其中，λcoord =5 ，λnoobj =0.5，1obji 表示是否物体出现在gridcell i中，1objij表示grid cell i中的第j个边界框预测到了正确类别。
　　
　　训练过程数据：epoch:135batch size:64momentum:0.9decay:0.0005learning rate:前75为0.01，中间30为0.001，最后30为0.0001dropout layer rate:0.5YOLO的优势在于，外围库的依赖少，纯c和CUDA写成，唯一的依赖就是pthreads，不像caffe那样需要一堆的dll。当然，缺点就是，训练的模型文件太大，750多M，2G显存的电脑直接挂掉，tiny-yolo虽然小，但是效果却大打折扣。另一个缺点就是由于其自身结构的设计，使得对聚集，堆叠的物体检测不是很好，当然，fast RCNN，ssd等在这点上也没有变现出不俗的效果。就YOLO v1的速度和识别率来看，还是比SSD差点。当然所有的这些都在YOLO v2中得到了大大的改善。
　　
　　linux篇：YOLOv1的官方链接为，http://pjreddie.com/darknet/yolov1/，安装步骤：[plain] view plain copygit clonehttps://github.com/pjreddie/darknet.gitcd darknetvim Makefile修改GPU=1 OPENCV=1make -j8wgethttp://pjreddie.com/media/files/yolov1.weights./darknetyolo test cfg/yolov1/yolo.cfg yolov1.weights data/dog.jpg注意这里，yolov1.weights，官网现在给的是753M的，实际上我用这个没有跑出结果，用了小伙伴的780多M的成功跑出了上面的结果，就这一个地方，折腾了一下午，换了不同机器测试过，也是被官网坑了啊。如果不对之处，还请大神斧正。
　　
　　至此，YOLOv1就安装完毕，又可以愉快的玩耍了。
　　
　　windows篇：由于原版的官方YOLOv1是只支持linux 和mac的，如果要自己修改，可能需要走好对哦的坑，同时还得具备一定的技术水平，幸好有革命斗士为我们走出了这一步，可以参考下面2个YOLO-windows，https://github.com/frischzenger/yolo-windowshttps://github.com/AlexeyAB/yolo-windows随便下载上面的一个yolo，然后进入yolo-windows-master\build\darknet\下面，用vs2013直接打开darknet.sln，选择，x64版本，只要配置opencv和pthreads就可以，为了方便大家参考，这里贴出本人的环境配置，vc++目录，可执行文件，[plain] view plain copyE:\opencv2_4_12\build\x64\vc12\bin;G:\yolo-windows-master\3rdparty\dll\x64;vc++目录，包含目录，[plain] view plain copyE:\opencv2_4_12\build\include;E:\opencv2_4_12\build\include\opencv;E:\opencv2_4_12\build\include\opencv2;G:\yolo-windows-master\3rdparty\include;C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\ www.furggw.com/ v7.5\include（GPU版本加）
　　
　　vc++目录，库目录，[plain] view plain copyE:\opencv2_4_12\build\x64\vc12\lib;G:\yolo-windows-master\3rdparty\lib\x64;C:\Program www.hjha178.com Files\NVIDIA GPU Computing Toolkit\CUDA\v7.5\lib\x64（GPU版本加）
　　
　　链接器，输入，下面为release的输入，debug只将opencv的lib换成相应debug即可。
　　
　　[plain] view plain copypthreadVC2.lib;opencv_calib3d2412.lib;opencv_contrib2412.lib;opencv_core2412.lib;opencv_features2d2412.lib;opencv_flann2412.lib;opencv_gpu2412.lib;opencv_highgui2412.lib;opencv_imgproc2412.lib;opencv_legacy2412.lib;opencv_ml2412.lib;opencv_objdetect2412.lib;opencv_ts2412.lib;opencv_video2412.lib;cublas.lib（GPU版本加）
　　
　　curand.lib（GPU版本加）
　　
　　cudart.lib（GPU版本加）
　　
　　c/c++，预处理器[plain] view plain copy_CRT_SECURE_NO_WARNINGSOPENCVGPU（GPU版本加）
　　
　　环境配好，点击生成就可以，debug版本的生成信息，release版本的生成信息，进入，yolo-windows-master\build\darknet\x64\Release\下面，去官网链接，http://pjreddie.com/media/files/ www.furong157.com yolov1.weights，下载好yolov1.weights，然后运行，darknet.cmd，随便输入一张图像，例如，person.jpg，就会出来运行效果。
　　
　　其中第一个为cpu+debug版本，第二个为cpu+release版本，

YOLO v1之总结篇（linux+windows）的更多相关文章

DNN：windows使用 YOLO V1，V2
本文有修改,如有疑问,请移步原文. 原文链接: YOLO v1之总结篇(linux+windows) 此外: YOLO-V2总结篇 Yolo9000的改进还是非常大的由于原版的官方YOLOv ...
在Mac/Linux/Windows上编译corefx遇到的问题及解决方法
这两天尝试在Mac/Linux/Windows三大平台上编译.NET跨平台三驾马车(coreclr/corefx/dnx)之一的corefx(.NET Core Framework),结果三个平台的编 ...
linux/Windows系统如何安装PHP-openssl扩展
今天倒腾了半天公司的OA办公系统,原来现在很多的smtp服务器是需要ssl方式加密的,而支持ssl需要php加载openssl扩展.所以本文我们将和大家一起分享如何在linux/Windows系统下安 ...
Mysql篇--Linux中安装Mysql
一.前述由于Windows安装Mysql非常麻烦,所以分享一篇Linux中对MySQL的搭建,废话不多说,来,come on. 二.步骤 2.1 yum安装 yum install mysql-se ...
Object Detection(RCNN, SPPNet, Fast RCNN, Faster RCNN, YOLO v1)
RCNN -> SPPNet -> Fast-RCNN -> Faster-RCNN -> FPN YOLO v1-v3 Reference RCNN: Rich featur ...
看完这篇 Linux 权限后，通透了！
我们在使用 Linux 的过程中,或多或少都会遇到一些关于使用者和群组的问题,比如最常见的你想要在某个路径下执行某个指令,会经常出现这个错误提示 . permission denied 反正我大概率见 ...
Linux 与 Linux Windows 文件共享小知识
Linux 与 Linux Windows 文件共享前提说明:windows主机信息:192.168.1.100 帐号:abc 密码:123 共享文件夹:sharelinux主机信息:192.1 ...
mouse scrollings and zooming operations in linux & windows are opposite
mouse scrollings and zooming operations in linux & windows are opposite. windows中, 鼠标滚动的方向是: 查看页 ...
linux/windows下启用和停止VMware后台服务的脚本
linux/windows下启用和停止VMware后台服务的脚本 linux/windows下启用和停止VMware后台服务的脚本 linux平台 windows平台本文由乌合之众 lym瞎编,欢迎 ...

随机推荐

【搜索好题】bzoj1501 [NOI2005]智慧珠游戏
bzoj1501 [NOI2005]智慧珠游戏搜索苟逼题系列. 暴力枚举每一种情况(包括旋转翻转全都考虑在内)然后码出代码. (正解似乎不是这样子的) 那年好像还有平衡树苟逼题维护数列233333心 ...
Vue视图
1. 基本模板语法 1.1 插值文本数据绑定最常见的形式就是使用“Mustache”语法 (双大括号) 的文本插值 v-text 指令也可以用于数据绑定,如果要更新部分的 textContent ...
【转】bash: ssh: command not found解决方法（linux）
原文转自:http://www.cnblogs.com/ahauzyy/archive/2013/04/25/3043699.html 今天在搭建hadoop的开发环境中,用的是centsos6.0的 ...
php-laravel安装与使用
1.框架作用提供了一些主体功能,方便开发者快速开发 2.PHP框架 laravel ThinkPHP 3.首先要安装composer软件 1.作用主要管理PH ...
Arduino语言
Arduino语言 Arduino语言是建立在C/C++基础上的,其实也就是基础的C语言,Arduino语言只不过把AVR单片机(微控制器)相关的一些参数设置都函数化,不用我们去了解他的底层,让我们不 ...
《C++设计新思维》勘误，附C++14新解法
勘误: 原书(中文版)3.13节,65-69页中GenScatterHierarchy以及FieldHelper均存在问题,当TypeList中类型有重复时,无法通过编译(原因在于“二义性基类”). ...
openstack系列文章（三）
学习openstack的系列文章-glance glance 基本概念 glance 架构 openstack CLI Troubleshooting 1. glance 基本概念在 opensta ...
从零开始的Python学习Episode 12——迭代器&生成器
生成器列表生成式用于快速地生成一个列表 a = [x*x for x in range(1,9)] print(a) #输出[1, 4, 9, 16, 25, 36, 49, 64] 也可以用于生 ...
Ubuntu环境下No module named '_tkinter'错误的解决
在Ubuntu环境下运行下面代码: import matplotlib as plt 出现以下错误: No module named '_tkinter' 解决方法: sudo apt-get ins ...
virtualbox 5.0.6 在debian jessie amd64启动报错
通过dmesg发现vboxdrv启动报错: [ 18.844888] systemd[1]: [/lib/systemd/system/vboxdrv.service:5] Failed to add ...

YOLO v1之总结篇（linux+windows）

YOLO v1之总结篇（linux+windows）的更多相关文章

随机推荐

热门专题