pytorch中神经网络的多线程数设置：torch.set_num

实验室的同学一直都是在服务器上既用CPU训练神经网络也有使用GPU的，最近才发现原来在pytorch中可以通过设置 torch.set_num_threads(args.thread) 来限制CPU上进行深度学习训练的线程数。

torch.set_num_threads(args.thread) 在使用时的一个注意事项就是如果不设置则默认使用物理CPU核心数的线程进行训练，而往往默认设置是可以保证运算效率最高的，因此该设置线程数是需要小于物理CPU核心数的，否则会造成效率下降。

既然默认设置既可以保证最高的运算效率那么这个设置的意义在哪呢，这个设置的意义就是在多人使用计算资源时限制你个人的改应用的计算资源占用情况，否则很可能你一个进程跑起来开了太多的线程直接把CPU占用率搞到50%或者直接奔100%去了。

总的说，该设置是为了在多人共享计算资源的时候防止一个进程抢占过高CPU使用率的。

给一个自己的设置代码：（实现了pytorch的最大可能性的确定性可复现性，并设置训练、推理时最大的线程数）

# pytorch的运行设备

device = None

def context_config(args):

    global device

    seed = args.seed

    random.seed(seed)

    np.random.seed(seed)

    torch.manual_seed(seed)

    torch.cuda.manual_seed(seed)

    torch.cuda.manual_seed_all(seed)

    torch.set_num_threads(args.thread)  # 设置pytorch并行线程数

    if torch.cuda.is_available() and args.gpu >= 0:

        torch.backends.cudnn.benchmark = False

        torch.backends.cudnn.deterministic = True

        device = torch.device('cuda:' + str(args.gpu))

    else:

        device = torch.device('cpu')

================================

运行DQN2013算法，CPU运行，CPU为Intel 10700k, 8核心16线程：

默认设置：

设置20线程：

torch.set_num_threads(20）

结果：

发现如果线程设置过多，超过CPU的物理线程数运行效率不仅没有提升反而下降，正常默认设置即可。

===================================

pytorch中神经网络的多线程数设置：torch.set_num_threads(N)的更多相关文章

PyTorch中，关于model.eval()和torch.no_grad()
一直对于model.eval()和torch.no_grad()有些疑惑之前看博客说,只用torch.no_grad()即可但是今天查资料,发现不是这样,而是两者都用,因为两者有着不同的作用引用 ...
【转载】 Pytorch中的学习率调整lr_scheduler,ReduceLROnPlateau
原文地址: https://blog.csdn.net/happyday_d/article/details/85267561 ------------------------------------ ...
pytorch中torch.nn构建神经网络的不同层的含义
主要是参考这里,写的很好PyTorch 入门实战(四)--利用Torch.nn构建卷积神经网络卷积层nn.Con2d() 常用参数 in_channels:输入通道数 out_channels:输出 ...
pytorch中文文档-torch.nn常用函数-待添加-明天继续
https://pytorch.org/docs/stable/nn.html 1)卷积层 class torch.nn.Conv2d(in_channels, out_channels, kerne ...
PyTorch 中 weight decay 的设置
先介绍一下 Caffe 和 TensorFlow 中 weight decay 的设置: 在 Caffe 中, SolverParameter.weight_decay 可以作用于所有的可训练参数, ...
如何设置活动监视器中的可见作业数能显示更长范围之内的作业（如何让bpdbjobs/Active Monitor显示更多作业信息）
一.问题: 如何设置可以使得活动监视器中的可见作业数能显示更长范围之内的作业(即NBU软件不要自动删除活动监视器中短时间内(如8天)内的作业记录)? 二.解决方法: 默认情况下在Ac ...
Direcshow中视频捕捉和參数设置报告
Direcshow中视频捕捉和參数设置报告 1. 关于视频捕捉(About Video Capture in Dshow) 1视频捕捉Graph的构建一个能够捕捉音频或者视频的graph图 ...
PyTorch 中 torch.matmul() 函数的文档详解
官方文档 torch.matmul() 函数几乎可以用于所有矩阵/向量相乘的情况,其乘法规则视参与乘法的两个张量的维度而定. 关于 PyTorch 中的其他乘法函数可以看这篇博文,有助于下面各种乘法的 ...
pytorch中的激励函数（详细版）
初学神经网络和pytorch,这里参考大佬资料来总结一下有哪些激活函数和损失函数(pytorch表示) 首先pytorch初始化: import torch import t ...
第五章——Pytorch中常用的工具
2018年07月07日 17:30:40 __矮油不错哟阅读数:221 1. 数据处理数据加载 ImageFolder DataLoader加载数据 sampler:采样模块 1. 数据处理 ...

随机推荐

spring eureka服务注册配置,排查服务注册上来了，但是请求没有过来。检查是否服务注册配置错误
spring eureka服务注册配置,排查服务注册上来了,但是请求没有过来.检查是否服务注册配置错误解决方法: 去掉该配置eureka.instance.hostname = client微服务的 ...
关于 "= default" 和 "= delete" 函数
在 C++ 11 中,"= default" 和 "= delete" 函数使我们能够显示指定成员函数是否自动生成. 其中,"= delete&quo ...
《史记 XuYu列传》
前言甲辰年二月十九,余记挂友人须臾.大醉,作此篇以悼念故友.忆往昔同窗之情,言语无不有经天纬地之能,举手投足间便可斩敌方上将.能文能武,乃当世之奇才,其言语中有大智慧.(文体并不重要) 吃饭时 Xu ...
Python优雅遍历字典删除元素的方法
在Python中,直接遍历字典并在遍历过程中删除元素可能会导致运行时错误,因为字典在迭代时并不支持修改其大小.但是,我们可以通过一些方法间接地达到这个目的. 1.方法一:字典推导式创建新字典(推荐) ...
Linux 增加 swap 分区
检查当前swap分区 [root@localhost ~]# free -g total used free shared buffers cached Mem: 15 0 14 0 0 0 -/+ ...
忘记Linux密码这样破解
忘记了Linux的密码该怎么办呢?有人想到重装系统.我想说除非你不想干了! 在这里使用CentOS7来教大家怎么破解Linux的密码 (不能知道原来的密码,但是可以强行修改) 1.在grub引导界面 ...
【VMware vSphere】使用RVTools中的PowerShell脚本创建导出vSphere环境信息的自动化任务。
RVTools 是 VMware 生态系统中一个非常受欢迎且免费的 Windows 实用工具,用于收集并显示 VMware vSphere 环境中的相关信息,如虚拟机.主机及集群等相关配置.RVToo ...
WPF 做一个超级简单的 1024 数字接龙游戏
这是一个我给自己做着玩的游戏,没有什么复杂的界面,就一些简单的逻辑游戏的规则十分简单,那就是有多个列表.程序会给出一个数字,玩家决定数字放在哪个列表里面.如果放入列表里面的数字和列表里面最后一个数字 ...
CF1320D Reachable Strings
110和011互相转化,相当于就是0在连续两个1的情况下,移动两个位置能够发现,0的位置的奇偶不会改变,且很多个0之间的相对位置不会改变猜想考虑这个答案只跟0的奇偶性有关,下面小证一下:(注意下面 ...
vim 中代码的折叠和打开
# vim 中代码的折叠和打开 reference: vim中代码的折叠和打开(有删改) https://www.cnblogs.com/xuxm2007/archive/2011/11/10/224 ...

pytorch中神经网络的多线程数设置：torch.set_num_threads(N)

pytorch中神经网络的多线程数设置：torch.set_num_threads(N)的更多相关文章

随机推荐

热门专题