detectron2安装出现Kernel not compiled with GPU support 报错信息
在安装使用 detectron2 的时候碰到**Kernel not compiled with GPU support **问题,前后拖了好久都没解决,现总结一下以备以后查阅。
不想看心路历程的可以直接跳到最后一小节,哈哈哈。
environment
因为我使用的是实验室的服务器,所以很多东西没法改,我的 cuda 环境如下:
- ubuntu
nvcc默认版本是 9.2nvidia-smi版本又是 10.0 的
我之前一直没搞清楚这
nvcc和nvidia-smi版本为什么可以不一样,想了解原因的可以看一下我之前的文章显卡,显卡驱动,nvcc, cuda driver,cudatoolkit,cudnn 到底是什么?。
reproduce
我一般都用 Anaconda 来安装 pytorch,第一次安装的时候使用的如下命令安装的:
conda create -n myenv python=3.7
conda activate myenv
conda install pytorch torchvision cudatoolkit=10.1 -c pytorch
按理说这个命令会给myenv环境安装 cuda 编译器和驱动等,但是在运行代码的时候还是会出现标题中的报错信息。我猜可能是因为 detectron2 在 build 的时候使用的是/usr/local路径下的 cuda compiler(即 nvcc),而不是我的虚拟幻境下的 compiler。所以我重新安装了 cuda-9.2 版本的 pytorch,
conda install pytorch torchvision cudatoolkit=9.2 -c pytorch
但是运行的时候还是出现同样的错误,这更加说明 detectron2 的编译使用的不是虚拟环境路径下的编译器,所以我在想是不是我没有正确设置系统路径下的 CUDA,于是我用官方提供的检验代码查看 CUDA 路径:
python -c 'import torch; from torch.utils.cpp_extension import CUDA_HOME; print(torch.cuda.is_available(), CUDA_HOME)'
输出的结果是
true /usr/local
可以看到CUDA_HOME对应的输出结果有问题,照理来说输出结果应该是/usr/local/cuda或者/usr/local/cuda-9.2之类的,于是我又查看了~/.bashrc文件,找到与 CUDA 有关的代码部分,发现我并没有设置CUDA_HOME这个环境变量,于是我做了如下修改:
# vim ~/.bashrc
export CUDA_HOME=/usr/local/cuda
export PATH=$PATH:/usr/local/cuda/bin
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64:/usr/local/cuda/lib
export LIBRARY_PATH=$LIBRARY_PATH:/usr/local/cuda/lib64
之后 souce 一下
source ~/.bashrc
再运行python -c 'import torch; from torch.utils.cpp_extension import CUDA_HOME; print(torch.cuda.is_available(), CUDA_HOME)'输出的结果变为true /usr/local/cuda
此时Kernel not compiled with GPU support的问题就解决了,代码正常运行了。
总结
步骤总结
- 安装相关库
conda create -n myenv python=3.7
conda activate myenv
conda install pytorch torchvision cudatoolkit=9.2 -c pytorch
pip install opencv-python
pip install 'git+https://github.com/facebookresearch/fvcore'
pip install cython; pip install 'git+https://github.com/cocodataset/cocoapi.git#subdirectory=PythonAPI'
- 编译 detectron2
python setup.py build develop
可能出现的问题和解决办法
出现标题中的错误的原因主要是因为你的 cuda 版本或者路径除了问题,你可以按照如下几个步骤排查可能是那个地方出了问题:
- 运行
nvcc --version查看你的 cuda 编译器版本,那么你的 pytorch-gpu 也建议安装对应版本。当然如果你nvcc都没安装。。。那你就先找教程安装。 - 如果安装的 pytorch 版本和
nvcc版本一致,你可以看一下你的 CUDA 路径是否在~/.bashrc中设置正确,参考的配置路径如下:
# vim ~/.bashrc
export CUDA_HOME=/usr/local/cuda
export PATH=$PATH:/usr/local/cuda/bin
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64:/usr/local/cuda/lib
export LIBRARY_PATH=$LIBRARY_PATH:/usr/local/cuda/lib64
设置好后source ~/.bashrc,然后删除detectron2/build文件夹(如果你之前已经编译过一遍了),然后重新编译dete2tron2。
感谢xiedian一句话总结了上面的问题根本原因:
上述问题其实是因为 conda 安装的 cudatools 只是一个子集,里面是没有 nvcc 的,要用 nvcc 就必须用系统装的
detectron2安装出现Kernel not compiled with GPU support 报错信息的更多相关文章
- PXE+kickstart网络安装CentOS7.4系统及过程中各种报错
环境:关闭防火墙.selinux 注意:虚拟机进行网络安装的话,7.3以后的系统是需要2G以上的内存 [root@kickstart ~]# cat /etc/redhat-release CentO ...
- Linux下安装redis报错信息
redis在Linux安装报错 标签: redislinuxcentos 2017-02-24 13:46 384人阅读 评论(0) 收藏 举报 分类: Linux安装工具(2) 版权声明:本文为 ...
- epel安装第三方扩展源后,运行yum报错的解决方案
yum安装报错:Cannot retrieve metalink for repository: epel. Please verify its path and try again 解决方法: 一句 ...
- 解决Ubuntu(Linux)平台下Sublime Text 3 安装中文输入支持库后 开启gnome-terminal报错的问题
在Ubuntu下安装Sublim Text3后发现无法输入中文,按照此链接的方法解决后.然后用下列代码配置C++的编译系统: { "cmd":["g++",&q ...
- 安装HDP时的报错信息
1,安装ambari时报错:Bootstrap process timed out. It will be destroyed. 报错原因:/etc/sudoers文件中未设置免密权限 解决办法:ha ...
- 安装php WampServer之后,运行的时候报错“phpMyAdmin - 错误 缺少 mysqli 扩展。请检查 PHP 配置。”
今天在安装了WampServer2.1a-x32之后,点击WampServer的图标启动WampServer,在电脑右下角就可以看到WampServer启动之后的图标,然后点击“Start All S ...
- python安装matplotlib:python -m pip install matplotlib报错
matplotlib是python中强大的画图模块. 首先确保已经安装python,然后用pip来安装matplotlib模块. 进入到cmd窗口下,建议执行python -m pip install ...
- 安装监控MongoDB的Python安装包时候报错:HTTP Error 403: SSL is required
安装pymongo-2.3.tar.gz,执行命令python setup.py install报错: HTTP Error 403: SSL is required 分析原因:安装需要下载这个dis ...
- 14、CentOS7安装过程中,磁盘大于2T的报错处理
问题描述 服务器磁盘单盘空间大于2TB,在安装CentOS7时出现下图报错: Boot failure.Reboot and Select proper Boot device... 问题原因: 安装 ...
随机推荐
- [HNOI2002] Kathy 函数
数位 DP 套路题,求二进制下区间内回文串个数. 设 dp[][][] 表示到第几位时,是否为回文数,去掉前导零后共几位.之后到边界时判断是否为回文数计入贡献. 一开始不知道答案统计要高精,于是后来就 ...
- MACbook关机开机的咚咚咚声音
在MAC系统中,设置→声音设置→内置扬声器静音即可. windows下面没有试过.
- [LeetCode] 854. K-Similar Strings 相似度为K的字符串
Strings A and B are K-similar (for some non-negative integer K) if we can swap the positions of two ...
- rIoTboard学习系列
刚在咸鱼买了块开发板,比较老了14年的,SOC为imx6solo,内核3.10,uboot2009的,准备先移植一个较新的uboot 到nxp的git下获取他们维护的uboot,网址http://gi ...
- subprocess实用手册
背景 python执行操作系统的命令,如python执行shell命令 subprocess模块主要用于创建子进程,并连接它们的输入.输出和错误管道,获取它们的返回状态.通俗地说就是通过这个模块,你可 ...
- 第三次实验报告:使用Packet Tracer分析TCP连接建立过程
目录 1 实验目的 2 实验内容 3. 实验报告 3.1 建立网络拓扑结构 3.2 配置参数 3.3 抓包,分析TCP连接建立过程 4. 拓展 (不作要求,但属于加分项) 1 实验目的 使用路由器连接 ...
- Loj #3102. 「JSOI2019」神经网络
Loj #3102. 「JSOI2019」神经网络 题目背景 火星探险队发现,火星人的思维方式与人类非常不同,是因为他们拥有与人类很不一样的神经网络结构.为了更好地理解火星人的行为模式,JYY 对小镇 ...
- R语言学习基础一
笔者使用Rstudio编写R程序,本文主要总结在编写过程中遇到的一些实际 问题 与学习配套的的code上传到我的github,网址: https://github.com/LIU-HONGYANG/S ...
- ant-design自定义FormItem--上传文件组件
自定义上传组件,只需要在内部的值变化之后调用props中的onChange方法就可以托管在From组件中, 此外为了保证,初始化值发生变化后组件也发生变化,需要检测initialValue 变化,这是 ...
- StuQ技能图谱