YOLOv4实用训练实践
YOLOv4实用训练实践
准备工作
- 推荐使用Ubuntu 18.04
- CMake >= 3.8: https://cmake.org/download/
- CUDA >= 10.0: https://developer.nvidia.com/cuda-toolkit-archive
- OpenCV >= 2.4: https://opencv.org/releases.html
- cuDNN >= 7.0 for CUDA >= 10.0https://developer.nvidia.com/rdp/cudnn-archive
- GPU with CC >= 3.0: https://en.wikipedia.org/wiki/CUDA#GPUs_supported
- GCC
Linux上编译
下载YOLOv4源码,推荐使用Ubuntu 18.04:
sudo apt-get install -y git
git clone https://github.com/AlexeyAB/darknet.git
配置Makefile文件中的参数,然后运行make -j8进行编译,具体参数解释如下:
GPU=1使用CUDA和GPU(CUDA默认路径为/usr/local/cuda)CUDNN=1使用cuDNN v5-v7加速网络(cuDNN默认路径/usr/local/cudnn)CUDNN_HALF=1使用Tensor Cores(可用GPU为Titan V / Tesla V100 / DGX-2或者更新的)检测速度3x,训练速度2xOPENCV=1使用OpenCV 4.x/3.x/2.4.x,运行检测视频和摄像机DEBUG=1编译调试版本OPENMP=1使用OpenMP利用多CPU加速LIBSO=1编译darknet.so
§
使用uselib来运行YOLO,输入指令如下: LD_LIBRARY_PATH=./:$LD_LIBRARY_PATH ./uselib test.mp4
§ 在自己的代码中嵌入YOLO,请参考例程: https://github.com/AlexeyAB/darknet/blob/master/src/yolo_console_dll.cpp
ZED_CAMERA=1 增加ZED-3D相机的支持(需要先安装好ZED SDK)
§
运行LD_LIBRARY_PATH=./:$LD_LIBRARY_PATH ./uselib data/coco.names cfg/yolov4.cfg yolov4.weights zed_camera
常见编译问题
/bin/sh: 1: nvcc: not found
首先确保CUDA正确安装,并且在路径/usr/local/cuda下,然后输入如下指令:
echo "PATH=/usr/local/cuda/bin:$PATH" >> ~/.bashrc
source ~/.bashrc
include/darknet.h:46:10: fatal error: cudnn.h: No such file or directory
首先下载cuDNN,https://developer.nvidia.com/rdp/cudnn-archive,需要根据自己的CUDA版本选择,然后解压,输入指令:
sudo cp -r cudnn-10.1-linux-x64-v7.6.5.32/cuda /usr/local/cudnn
运行代码
预训练模型
所有模型都是在MS-COCO数据集上训练,模型包括两个文件(cfg和weights)
R表示在RTX 2070设备上的FPS,V表示在Tesla V100设备上的FPS
百度网盘打包下载,链接:https://pan.baidu.com/s/1QQPB27n18XeRDnhHA2Gxuw,提取码:uill
- yolov4.cfg - 245 MB: yolov4.weights
§
width=608 height=608: 65.7 AP@0.5 | 43.5 AP@0.5:0.95 - 34(R) FPS / 62(V) FPS - 128.5 BFlops
§ width=512 height=512: 64.9 AP@0.5 | 43.0 AP@0.5:0.95 - 45(R) FPS / 83(V) FPS - 91.1 BFlops
§ width=416 height=416: 62.8 AP@0.5 | 41.2 AP@0.5:0.95 - 55(R) FPS / 96(V) FPS - 60.1 BFlops
§ width=320 height=320: 60.0 AP@0.5 | 38.0 AP@0.5:0.95 - 63(R) FPS / 123(V) FPS - 35.5 BFlops
yolov3-tiny-prn.cfg - 18.8 MB: yolov3-tiny-prn.weights
§
width=416 height=416: 33.1 AP@0.5 - 370(R) FPS - 3.5 BFlops
enet-coco.cfg (EfficientNetB0-Yolov3) - 18.3 MB: enetb0-coco_final.weights
§
width=416 height=416: 45.5 AP@0.5 - 55(R) FPS - 3.7 BFlops
csresnext50-panet-spp-original-optimal.cfg - 217 MB: csresnext50-panet-spp-original-optimal_final.weights
§
width=608 height=608: 65.4 AP@0.5 | 43.2 AP@0.5:0.95 - 32(R) FPS - 100.5 BFlops
yolov3-spp.cfg - 240 MB: yolov3-spp.weights
§
width=608 height=608: 60.6 AP@0.5 - 38(R) FPS - 141.5 BFlops
yolov3.cfg - 236 MB: yolov3.weights
§
width=416 height=416: 55.3 AP@0.5 - 66(R) FPS - 65.9 BFlops
yolov3-tiny.cfg - 33.7 MB: yolov3-tiny.weights
§
width=416 height=416: 33.1 AP@0.5 - 345(R) FPS - 5.6 BFlops
可以在如下路径找到所有的cfg文件: darknet/cfg/
运行指令介绍
需要将训练好的weights文件放到darknet根目录下,运行如下指令:
- 检测单张图像
- 检测给定路径的单张图像(参数最后的路径需要写待检测图像的路径)
- 检测给定路径的单个视频
- 检测给定路径的单个视频,并将检测结果保存为视频
- 利用摄像机实时检测(YOLOv4)
- 利用摄像机实时检测(YOLOv3-Tiny)
- 在GPU1上检测给定路径的单个视频
- 检测列表
data/train.txt中图像,并将结果保存在result.json - 检测列表
data/train.txt中图像,并将结果保存在result.txt
./darknet detector test cfg/coco.data cfg/yolov4.cfg yolov4.weights -thresh 0.25
./darknet detector test cfg/coco.data cfg/yolov4.cfg yolov4.weights -ext_output /home/jario/Pictures/h1.jpg
./darknet detector demo cfg/coco.data cfg/yolov4.cfg yolov4.weights -ext_output test.mp4
./darknet detector demo cfg/coco.data cfg/yolov4.cfg yolov4.weights test.mp4 -out_filename res.avi
./darknet detector demo cfg/coco.data cfg/yolov4.cfg yolov4.weights -c 0
./darknet detector demo cfg/coco.data cfg/yolov3-tiny.cfg yolov3-tiny.weights -c 0
./darknet detector demo cfg/coco.data cfg/yolov3-tiny.cfg yolov3-tiny.weights -i 1 test.mp4
./darknet detector test cfg/coco.data cfg/yolov4.cfg yolov4.weights -ext_output -dont_show -out result.json < data/train.txt
./darknet detector test cfg/coco.data cfg/yolov4.cfg yolov4.weights -dont_show -ext_output < data/train.txt > result.txt
如何训练
如何构建自己的训练数据
下载数据集标注工具,下载地址:(https://pan.baidu.com/s/1EE52cDStjIxsRgM_a9pWQQ) (password: 4b2q) 或者 Spire Web.
数据集管理软件github地址:https://github.com/jario-jin/spire-image-manager

开始训练YOLO
使用YOLOv4和YOLOv3:
1. 针对选择的模型,下载预训练权重:
百度网盘打包下载,链接:https://pan.baidu.com/s/1CNVyyjoph7YVSXGT3vjbfQ,提取码:4usc
o 对于 yolov4.cfg, yolov4-custom.cfg (162 MB): yolov4.conv.137
o 对于 csresnext50-panet-spp.cfg (133 MB): csresnext50-panet-spp.conv.112
o 对于 yolov3.cfg, yolov3-spp.cfg (154 MB): darknet53.conv.74
o 对于 yolov3-tiny-prn.cfg , yolov3-tiny.cfg (6 MB): yolov3-tiny.conv.11
o 对于 enet-coco.cfg (EfficientNetB0-Yolov3) (14 MB): enetb0-coco.conv.132
2. 将cfg/yolov4-custom.cfg拷贝一份,重命名为yolov4-obj.cfg(obj可以是自定义名称)
o 修改batch为batch=64
o 修改subdivisions为subdivisions=16
o 修改max_batches为(类别数量*2000,但不要小于4000),如训练3个类别max_batches=6000
o 修改steps为max_batches的0.8与0.9,如steps=4800,5400
o 修改classes=80为自定义数据集的类别数量,主要需要修改3处(3个[yolo]层):
o https://github.com/AlexeyAB/darknet/blob/0039fd26786ab5f71d5af725fc18b3f521e7acfd/cfg/yolov3.cfg#L610
o https://github.com/AlexeyAB/darknet/blob/0039fd26786ab5f71d5af725fc18b3f521e7acfd/cfg/yolov3.cfg#L696
o https://github.com/AlexeyAB/darknet/blob/0039fd26786ab5f71d5af725fc18b3f521e7acfd/cfg/yolov3.cfg#L783
o 修改filters=255为filters=(classes+5)x3,在3个[yolo]层的前一个[convolutional]层,分别为:
o https://github.com/AlexeyAB/darknet/blob/0039fd26786ab5f71d5af725fc18b3f521e7acfd/cfg/yolov3.cfg#L603
o https://github.com/AlexeyAB/darknet/blob/0039fd26786ab5f71d5af725fc18b3f521e7acfd/cfg/yolov3.cfg#L689
o https://github.com/AlexeyAB/darknet/blob/0039fd26786ab5f71d5af725fc18b3f521e7acfd/cfg/yolov3.cfg#L776
o 如果使用[Gaussian_yolo]层,修改filters=57为filters=(classes+9)x3,在3个[Gaussian_yolo]层的前一个[convolutional]层,分别为:
§
https://github.com/AlexeyAB/darknet/blob/6e5bdf1282ad6b06ed0e962c3f5be67cf63d96dc/cfg/Gaussian_yolov3_BDD.cfg#L604
§ https://github.com/AlexeyAB/darknet/blob/6e5bdf1282ad6b06ed0e962c3f5be67cf63d96dc/cfg/Gaussian_yolov3_BDD.cfg#L696
§ https://github.com/AlexeyAB/darknet/blob/6e5bdf1282ad6b06ed0e962c3f5be67cf63d96dc/cfg/Gaussian_yolov3_BDD.cfg#L789
o
例如,如果classes=1,则filters=18;如果classes=2,则filters=21。注意:不要在cfg文件中直接写: filters=(classes+5)x3)
3. 在darknet/data路径下创建obj.names,其中每一行是一个目标类别名称
o 将数据集标注得到的文件Yolo_categories.names重命名为obj.names,并放到darknet/data下
4. 在darknet/data路径下创建obj.data:
教程 darknet 路径为 /home/user/darknet,本文以此为例,请根据自己的路径进行修改。在 /home/user/darknet/cfg/ 文件夹下新建一个文件,名字叫 obj.data 在里面写入:
classes = 1
train = /home/user/darknet/data/coco/Yolo_20180908_234114.txt
valid = /home/user/darknet/data/coco/Yolo_20180908_234114.txt
names = data/obj.names
backup = backup
eval = coco
注意:classes 为类别数量,对于单类检测问题,写 1
5. 将图像文件(.jpg)与标注文件放入到如下路径darknet\data\coco\路径下
o 将scaled_images里的图像拷贝到 /home/user/darknet/data/coco/images/train下
o 将Yolo_labels里的标注文件拷贝到/home/user/darknet/data/coco/images/train下
o 将Yolo_20180908_234114.txt拷贝到/home/user/darknet/data/coco下
6. 开始训练
o 训练指令:./darknet detector train data/obj.data cfg/yolo-obj.cfg yolov4.conv.137
(对于最新100次迭代的最新权重yolo-obj_last.weights会保存在darknet\backup\)
(对于每1000次迭代的权重yolo-obj_xxxx.weights会保存在darknet\backup\)
(关闭Loss的显示窗口./darknet detector train data/obj.data cfg/yolo-obj.cfg yolov4.conv.137 -dont_show)
(通过浏览器查看训练过程./darknet detector train data/obj.data yolo-obj.cfg yolov4.conv.137 -dont_show -mjpeg_port 8090 -map,然后打开Chrome浏览器,输入http://ip-address:8090)
(如果需要在训练中计算mAP,每4期计算一次,需要在obj.data文件中设置valid=valid.txt,运行:./darknet detector train data/obj.data yolo-obj.cfg yolov4.conv.137 -map)
7. 训练结束,结果保存在darknet\backup\yolo-obj_final.weights
o 如果训练中断,可以选择一个保存的权重继续训练,使用./darknet detector train data/obj.data yolo-obj.cfg backup\yolo-obj_2000.weights
注意:在训练中,如果avg(loss)出现nan,则训练出了问题,如果是其他字段出现nan,这种情况是正常的。注意:如果需要改变cfg文件中的width=或height=,新的数字需要被32整除。注意:训练完成后,检测指令为:./darknet detector test data/obj.data yolo-obj.cfg yolo-obj_8000.weights。注意:如果出现Out of memory,需要修改cfg文件中的subdivisions=16为32或64。
训练YOLOv3-Tiny
训练YOLOv3-Tiny与选了YOLOv4、YOLOv3基本相同,主要有以下小区别:
1. 下载yolov3-tiny预训练权重,运行命令./darknet partial cfg/yolov3-tiny.cfg yolov3-tiny.weights yolov3-tiny.conv.15 15
2. 新建自定义cfg文件yolov3-tiny-obj.cfg(可以复制cfg/yolov3-tiny.cfg为yolov3-tiny-obj.cfg)
3. 运行训练命令:./darknet detector train data/obj.data yolov3-tiny-obj.cfg yolov3-tiny.conv.15
多GPU训练
1. 首先在1块GPU上训练1000次./darknet detector train cfg/coco.data cfg/yolov4.cfg yolov4.conv.137
2. 停止训练,使用权重darknet/backup/yolov4_1000.weights,在多块GPU上训练,运行./darknet detector train cfg/coco.data cfg/yolov4.cfg /backup/yolov4_1000.weights -gpus 0,1,2,3
注意:如果出现nan,应该降低学习率,如4块GPUlearning_rate=0.00065(learning_rate=0.00261/GPUs),还应该增加cfg文件中的burn_in=为原先的4x,如burn_in=4000
训练常见程序问题
注意:如果出现如下错误

需要修改源码/home/user/darknet/src/data.c 将如下代码
list *get_paths(char *filename)
{
char *path;
FILE *file = fopen(filename, "r"); if(!file) file_error(filename); list *lines = make_list(); while((path=fgetl(file))) { list_insert(lines, path); } fclose(file); return lines;}
修改为:
void ltrim(char *s)
{
char *p; p = s;
while (*p == ' ' || *p == '\t' || *p == '\r') { p++; } strcpy(s,p);
}
void rtrim(char *s)
{
int i;
i = strlen(s) - 1;
while ((s[i] == ' ' || s[i] == '\t' || s[i] == '\r') && i >= 0 ) { i--; } s[i+1] = '\0';
}
void _trim(char *s)
{
ltrim(s);
rtrim(s);
}
list *get_paths(char
*filename)
{
char *path;
FILE *file = fopen(filename, "r");
if(!file) file_error(filename); list *lines = make_list();
while((path=fgetl(file))) {
_trim(path); list_insert(lines, path);
}
fclose(file); return lines;
} 保存,make -j8重新编译 下面为正常训练时画面

何时应该停止训练
通常情况下,为每个类别迭代2000次是足够的,且总的迭代次数不能低于4000次。但是如果想要更加精确的停止时间,可以参考以下说明:
1.
在训练过程中,你会看到一系列训练误差,当0.XXXXXXX avg这个参数不再下降时,就该停止训练了
Region Avg IOU: 0.798363, Class: 0.893232,
Obj: 0.700808, No Obj: 0.004567, Avg Recall: 1.000000, count: 8 Region Avg IOU:
0.800677, Class: 0.892181, Obj: 0.701590, No Obj: 0.004574, Avg Recall:
1.000000, count: 8 9002: 0.211667, 0.60730
avg, 0.001000 rate, 3.868000 seconds, 576128 images Loaded: 0.000000
seconds
- 9002 - 迭代数量(batch数量)
- 0.60730
avg - 平均损失(误差),越低越好
如果发现0.XXXXXXX avg在很多次迭代后都不再降低,则是时候该停止训练了。最终的平均损失从0.05(对于小模型和简单训练数据)到3.0(对于大模型和复杂训练数据)不等。
2.
当训练停止之后,可以从darknet\backup中取出最新保存的训练权重.weights,并选择它们中检测效果最好的
例如,当训练9000次停止后,效果最好的模型可能是之前保存权重中的一个(7000,8000,9000),这是因为过拟合(Overfiting)现象。过拟合的表现可以解释为,在训练图像上检测效果很好,但是在其他图像上效果不佳,这时候就该尽早停止训练(早停点)。

2.1 首先,你需要在obj.data中指定验证数据集valid=valid.txt,如果你没有准备验证数据集,可以简单的复制data\train.txt为data\valid.txt。
2.2 如果你在迭代9000次之后停止训练,验证之前的模型权重可以使用如下命令:
- ./darknet
detector map data/obj.data cfg/yolo-obj.cfg backup\yolo-obj_7000.weights - ./darknet
detector map data/obj.data cfg/yolo-obj.cfg backup\yolo-obj_8000.weights - ./darknet
detector map data/obj.data cfg/yolo-obj.cfg backup\yolo-obj_9000.weights
然后对比每个权重(7000,8000,9000)最后一行输出,选择mAP(mean average precision)最高权重,或者对比IoU(intersect over union)进行选择。
例如,yolo-obj_8000.weights的mAP最高,则使用这个权重。或者在训练时加上-map参数:
./darknet detector train data/obj.data cfg/yolo-obj.cfg yolov4.conv.137 -map
结果如下图所示,mAP每4期(Epoch)通过obj.data中设置的验证集valid=valid.txt上计算一次(1期=train_txt中图像数量 / batch 次迭代)。

运行训练好的模型,进行目标检测,执行:
./darknet detector test data/obj.data cfg/yolo-obj.cfg yolo-obj_8000.weights
如何提升检测效果
训练之前提升检测效果的技巧
- 设置
.cfg文件中random=1,可以使用多分辨率输入增加检测效果:link - 在
.cfg文件中增加网络的输入分辨率(设置任意可以被32整除的数字,如,height=608,width=608),可以增加精度 - 检查图像每个目标是否都被标记,图像中的所有目标都必须被正确标记,推荐使用数据管理工具检查:spire-image-manager
- Loss很大,mAP很低,是不是训练错了?在训练中使用
-show_imgs参数,能够可视化目标框真值,检查数据集是否出了问题。 - 对于每一个你要检测的物体,在训练数据集中至少需要有一个实例与之相似,包括:形状、物体侧面、相对大小、旋转角度、倾斜方位角、光照等。因此,你的训练数据集需要包含具有不同对象属性的图像:比例、旋转、光照、不同侧面、不同背景等。建议对每一类物体收集2000张不同图像,并迭代训练2000*类别数量次。
- 推荐在训练数据集中包含带有不希望检测的非标记目标的图像。负样本图像不需要方框标记(空
.txt文件),越多越好。 - 标注目标的最佳方式是:仅标注物体的可见部分,或标注物体的可见和重叠部分,或标注比整个物体稍多一点的部分(有一点间隙),标注你想让检测器检测的部分。
- 如果单幅图像中的物体很多,需要在
[yolo]层或[region]层中修改参数max=200或者更高(全局最大目标检测数量为0,0615234375*(width*height))。
如果想要检测小目标(图像被缩放到416*416后,小于16*16的目标)
- 在https://github.com/AlexeyAB/darknet/blob/6f718c257815a984253346bba8fb7aa756c55090/cfg/yolov4.cfg#L895修改`layers = 23`
- 在https://github.com/AlexeyAB/darknet/blob/6f718c257815a984253346bba8fb7aa756c55090/cfg/yolov4.cfg#L892修改`stride=4`
- 在https://github.com/AlexeyAB/darknet/blob/6f718c257815a984253346bba8fb7aa756c55090/cfg/yolov4.cfg#L989修改`stride=4`
- 如果想要同时检测大目标与小目标,可以使用修改模型:
§
全模型 - 5个yolo层:https://raw.githubusercontent.com/AlexeyAB/darknet/master/cfg/yolov3_5l.cfg
§ 小模型 - 3个yolo层:https://raw.githubusercontent.com/AlexeyAB/darknet/master/cfg/yolov3-tiny_3l.cfg
§ YOLOv4 - 3个yolo层:https://raw.githubusercontent.com/AlexeyAB/darknet/master/cfg/yolov4-custom.cfg
如果你训练的数据类别需要区分左右目标(如检测左右手,交通信号中的左右方向),则不能使用左右翻转图像增强,在cfg文件中设置flip=0: https://github.com/AlexeyAB/darknet/blob/3d2d0a7c98dbc8923d9ff705b81ff4f7940ea6ff/cfg/yolov3.cfg#L17
- 一般规则 - 您的训练数据集应包含待检测目标的相对大小的集合:
§
train_network_width * train_obj_width / train_image_width ~= detection_network_width * detection_obj_width / detection_image_width
§ train_network_height * train_obj_height / train_image_height ~= detection_network_height * detection_obj_height / detection_image_height
也就是,对于测试数据集中的每个物体,训练数据集中必须至少有一个具有相同类与大约相同相对大小的物体。如果训练数据中仅有占图像面积80-90%的物体,则训练后的网络不能够检测占图像面积1-10%的物体。
如果想加速训练(损失检测精度),可以在cfg文件layer-136中设置参数stopbackward=1
- 注意
物体的模型、侧面、光照、尺度、方位角等属性,从神经网络的内部角度来看,这些是不同的物体。因此,你想检测的物体越多,就应该使用越复杂的网络模型。 - 如果想要外包矩形框更加精确,可以在
[yolo]层中增加3个参数:ignore_thresh=.9 iou_normalizer=0.5 iou_loss=giou,这会增加mAP@0.9,同时降低mAP@0.5。 - 如果你比较熟悉检测网络了,可以重新计算自定义数据集的锚框(Anchor):
./darknet detector calc_anchors data/obj.data -num_of_clusters 9 -width 416 -height 416,然后设置cfg文件中3个[yolo]层9个锚框。同时需要改变每个[yolo]层中的锚框索引mask=,第一层有大于60*60的锚框,第二层有大于30*30的锚框,第三层相同。也需要改变每个[yolo]层之前的filters=(classes + 5)*<number of mask>。如果许多计算出的锚框不适合在适当的层下 - 那么就尝试使用默认锚框。 - 增加cfg文件中网络输入的分辨率,如,
height=608,width=608,或height=832,width=832,这样可以检测更小的目标。
训练之后提升检测效果的技巧
YOLOv4实用训练实践的更多相关文章
- 云原生的弹性 AI 训练系列之一:基于 AllReduce 的弹性分布式训练实践
引言 随着模型规模和数据量的不断增大,分布式训练已经成为了工业界主流的 AI 模型训练方式.基于 Kubernetes 的 Kubeflow 项目,能够很好地承载分布式训练的工作负载,业已成为了云原生 ...
- 如何使用 Yolov4 训练人脸口罩检测模型
前言 疫情当下,出入医院等公共场所都被要求佩戴口罩.这篇博客将会介绍如何使用 Yolov4,训练一个人脸口罩检测模型(使用 Yolov4 的原因是目前只复现到了 v4 ),代码地址为 https:// ...
- 『TensorFlow』分布式训练_其一_逻辑梳理
1,PS-worker架构 将模型维护和训练计算解耦合,将模型训练分为两个作业(job): 模型相关作业,模型参数存储.分发.汇总.更新,有由PS执行 训练相关作业,包含推理计算.梯度计算(正向/反向 ...
- Perseus-BERT——业内性能极致优化的BERT训练方案
一,背景——横空出世的BERT全面超越人类 2018年在自然语言处理(NLP)领域最具爆炸性的一朵“蘑菇云”莫过于Google Research提出的BERT(Bidirectional Encode ...
- 几个小实践带你快速上手MindSpore
摘要:本文将带大家通过几个小实践快速上手MindSpore,其中包括MindSpore端边云统一格式及华为智慧终端背后的黑科技. MindSpore介绍 MindSpore是一种适用于端边云场景的新型 ...
- YOLOv3和YOLOv4长篇核心综述(上)
YOLOv3和YOLOv4长篇核心综述(上) 对目标检测算法会经常使用和关注,比如Yolov3.Yolov4算法. 实际项目进行目标检测任务,比如人脸识别.多目标追踪.REID.客流统计等项目.因此目 ...
- Yolov3&Yolov4网络结构与源码分析
Yolov3&Yolov4网络结构与源码分析 从2018年Yolov3年提出的两年后,在原作者声名放弃更新Yolo算法后,俄罗斯的Alexey大神扛起了Yolov4的大旗. 文章目录 1. 论 ...
- [源码解析] 深度学习分布式训练框架 horovod (16) --- 弹性训练之Worker生命周期
[源码解析] 深度学习分布式训练框架 horovod (16) --- 弹性训练之Worker生命周期 目录 [源码解析] 深度学习分布式训练框架 horovod (16) --- 弹性训练之Work ...
- [源码解析] 深度学习分布式训练框架 horovod (18) --- kubeflow tf-operator
[源码解析] 深度学习分布式训练框架 horovod (18) --- kubeflow tf-operator 目录 [源码解析] 深度学习分布式训练框架 horovod (18) --- kube ...
随机推荐
- LA3415保守的老师
题意: 有n个学生,老师要带他们出去玩,但是老师比较保守,怕他们之间萌生爱意,所以带出去的所有同学必须至少满足四个条件中的一组,问最多能带多少人出去玩. 思路: 比较简单二分 ...
- Windows本地安全策略
目录 本地安全策略 密码策略 账户策略 审核策略 用户权限分配 安全选项 本地安全策略 安全策略是影响计算机安全性的安全设置的组合.可以利用本地安全策略来编辑本地计算机上的帐户 系统安全策略包括下面的 ...
- Intel汇编语言程序设计学习-第六章 条件处理-上
条件处理 本章要点 1.简介 2.布尔和比较指令 3.条件跳转 4.条件循环指令 5.条件结构 6.应用:有限状态机 7.决策伪指令 6.1 简介 本章,读者将看到高级条件分支如何翻译成底层的实现代 ...
- Python练习1-文档格式化成html
文档格式化成HTML 把文档格式化成了THML,并没有处理所有thml规则,只是处理了一部分,功能不重要,重要的是复习熟悉下Python对文档的处理细节.毕竟Python大多数给我的印象都是处理文档. ...
- 【easyUI】取消easyui行点击选中事件,智能通过勾选checkbox才能选中行
背景:项目中使用easyui作为前端架子.datagrid默认是点击行就选中此行然后变色. 需求:点击行不让此行选中:只能通过点击复选框才能选中某一行. 解决思路: 1.写点击行函数function ...
- liunx中文件夹不能删除怎么操作
1.运行rm -rf 文件名称 2.不能删除对应文件并且提示"rm: cannot remove './.user.ini': Operation not permitted" 操 ...
- Spring Boot & Cloud 轻量替代框架 Solon 1.3.33 发布
Solon 是一个微型的Java开发框架.强调,克制 + 简洁 + 开放的原则:力求,更小.更快.更自由的体验.支持:RPC.REST API.MVC.Micro service.WebSocket. ...
- hdu - 1716 排列2 (使用set对全排列结果去重)
题意很简单,只是有几个细节要注意,首先就是一次只是输入四个数字.输出结果要从小到大(进行全排列之前要进行排序).题目要求千位数相同的在一行,中间使用空格隔开(第二次在输出的时候判断上一次记录的千位数是 ...
- unapp一键登录
一.整理思路 un-app官网提供多种实现[一键登录](https://uniapp.dcloud.net.cn/uniCloud/univerify "")的方法,这里的选择是 ...
- Java反射机制以及动态代理
Java反射机制以及动态代理 Java反射机制 含义与功能 Java的反射(reflection)机制是指在程序的运行状态中,可以构造任意一个类的对象,可以了解任意一个对象所属的类,可以了解任意一个类 ...