在极算云安装pytorch0.4.1环境
1. 已经安装了anaconda。然后就可以创建你自己的环境了(你最好一定要指定个python版本,如下,
我指定为python3.6, 如果需要的话你也可以指定其他python版本,并不是说anaconda自带的是哪个python版本就只能用哪个python版本!)
conda create -n jjenv_pytorch python=3.6
1.1 切换环境:
conda activate jjenv_pytorch (退出这个环境用 conda deactivate)
2.在和工作人员沟通后得知1070GPU装的是cuda9,然后我去pytorch官网

按这个命令安装GPU版本的pytorch 0.4.1版本。
3. 安装torchvision
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple torchvision 其中-i 是代表临时使用的源,我这里临时使用清华源,因为pip install torchvision装不了卡住了,所以临时换了个源。
4.用如下几条命令看GPU版本的pytorch是否安装成功
In [1]: import torch In [2]: torch.cuda.current_device()
Out[2]: 0 In [3]: torch.cuda.device(0)
Out[3]: <torch.cuda.device at 0x7efce0b03be0> In [4]: torch.cuda.device_count()
Out[4]: 1 In [5]: torch.cuda.get_device_name(0)
Out[5]: 'GeForce GTX 1070'
5. 安装下项目需要的其他软件(用pip install)
[gensim] (https://github.com/RaRe-Technologies/gensim)
[cytoolz] (https://github.com/pytoolz/cytoolz)
[tensorboardX] (https://github.com/lanpa/tensorboard-pytorch)
[pyrouge] (https://github.com/bheinzerling/pyrouge) (for evaluation)
然后运行abstract.py的时候出现如下问题:
nohup: ignoring input
start training with the following hyper-parameters:
{'net': 'base_abstractor', 'net_args': {'vocab_size': 30004, 'emb_dim': 128, 'n_hidden': 256, 'bidirectional': True, 'n_layer': 1}, 'traing_params': {'optimizer': ('adam', {'lr': 0.001}), 'clip_grad_norm': 2.0, 'batch_size': 32, 'lr_decay': 0.5}}
Start training
/root/anaconda3/envs/jjenv_pytorch/lib/python3.6/site-packages/torch/nn/functional.py:52: UserWarning: size_average and reduce args will be deprecated, please use reduction='none' instead.
warnings.warn(warning.format(ret))
Traceback (most recent call last):
File "train_abstractor.py", line 220, in <module>
main(args)
File "train_abstractor.py", line 166, in main
trainer.train()
File "/data/rl_abs_other/fast_abs_rl/training.py", line 211, in train
log_dict = self._pipeline.train_step()
File "/data/rl_abs_other/fast_abs_rl/training.py", line 107, in train_step
log_dict.update(self._grad_fn())
File "/data/rl_abs_other/fast_abs_rl/training.py", line 20, in f
grad_norm = grad_norm.item()
AttributeError: 'float' object has no attribute 'item'
没有google到合适的解决方案,最后想到要不新建个虚拟环境重新装为GPU版本的pytorch0.4.0版本吧(因为我cpu版本的pytorch0.4.0能正常运行程序)
于是
把其中0.4.1改为0.4.0, 按如上操作一遍。
一跑程序没报错了。高兴。
在极算云安装pytorch0.4.1环境的更多相关文章
- CentOS6.5+php5.3听云安装过程
听云安装过程请参考听云安装指导页面:http://doc.tingyun.com/help/html/doc/server_novice.html 根据自己的服务器系统和语言包下载对应的 安装包 安装 ...
- 阿里云安装mysql后查看不到初始密码的解决办法
在阿里云安装mysql后用grep 'A temporary password' /var/log/mysqld.log命令查看MySQL初始密码,毛线都没有看到,然后直接到/var/log/mysq ...
- 阿里云安装RocketMQ
说明: 我的阿里云是centos 6.9 jdk 1.8.0_192-b12(安装教程参照:https://www.cnblogs.com/kingsonfu/p/9801556.html) mave ...
- 阿里云安装Nginx+vue项目部署
阿里云安装Nginx+vue项目部署 nginx安装包下载 http://nginx.org/en/download.html nginx安装 首先先安装PCRE pcre-devel 和Zlib,因 ...
- [开源软件] 腾讯云Linux服务器一键安装LAMP/LNMP/LANMP环境 转
本帖最后由 我本戏子 于 2015-8-13 22:00 编辑OneinStack是非常优秀的一键PHP/JAVA安装脚本,提供以下环境:lnmp(Linux + Nginx+ MySQL+ PHP) ...
- 开发指南专题4:JEECG高速微云开发平台--JEECG开发环境的搭建
开发指南专题4:JEECG微云高速开发平台开发环境搭建 1. JEECG开发环境搭建 JEECG推荐的开发环境为Myeclipse8.5/Eclipse3.7+JDK1.6+Tomcat6.0 1.1 ...
- Docker Data Center系列(一)- 快速搭建云原生架构的实践环境
本系列文章演示如何快速搭建一个简单的云原生架构的实践环境. 基于这个基础架构,可以持续部署微服务架构的应用栈,演练敏捷开发过程,提升DevOps实践能力. 1 整体规划 1.1 拓扑架构 1.2 基础 ...
- Linux学习3-yum安装java和Tomcat环境
前言 linux上安装软件,可以用yum非常方便,不需要下载解压,一个指令就能用yum安装java和tomcat环境. 前面一篇已经实现在阿里云服务器上搭建一个禅道系统的网站,算是小有成就,但并不是每 ...
- 微信小程序云开发之云函数的创建与环境配置
云函数的使用与环境配置: 1.创建云函数 右键cloudfunctions文件选择新建Node.js云函数,云函数命名为updateVoice用于修改用户语音数量. 2.安装node.js及npm: ...
随机推荐
- Redis cluster集群模式的原理
redis cluster redis cluster是Redis的分布式解决方案,在3.0版本推出后有效地解决了redis分布式方面的需求 自动将数据进行分片,每个master上放一部分数据 提供内 ...
- 一脸懵逼学习keepalived(对Nginx进行热备)
1:Keepalived的官方网址:http://www.keepalived.org/ 2:Keepalived:可以实现高可靠: 高可靠的概念: HA(High Available), 高可用性集 ...
- RPC服务超时排查思路
RPC服务超时排查思路- 1.查看服务提供者日志相关信息进行排查- 2.查看消费者的超时时间设置是否合理- 3.查看服务提供者业务逻辑是否有DB操作,有的话看是否有慢SQL- 4.查看服务提供者业务逻 ...
- Faster-RCNN tensorflow 程序细节
tf-faster-rcnn github:https://github.com/endernewton/tf-faster-rcnn backbone,例如vgg,conv层不改变feature大小 ...
- Genius ACM
题解: 发现匹配一定会选最大和最小匹配,确定左右端点之后nlogn排序后算 比较容易想到二分 最坏情况每次1个 $n^2*(logn)^2$ 没错暴力的最差复杂度是$n^2*logn$的 发现长度与次 ...
- ncat
ncat 或者说 nc 是一款功能类似 cat 的工具,但是是用于网络的.它是一款拥有多种功能的 CLI 工具,可以用来在网络上读.写以及重定向数据. 它被设计成可以被脚本或其他程序调用的可靠的后端工 ...
- Codeforces 311D Interval Cubing 数学 + 线段树 (看题解)
Interval Cubing 这种数学题谁顶得住啊. 因为 (3 ^ 48) % (mod - 1)为 1 , 所以48个一个循环节, 用线段树直接维护. #include<bits/stdc ...
- Codechef STMINCUT S-T Mincut (CodeChef May Challenge 2018) kruskal
原文链接http://www.cnblogs.com/zhouzhendong/p/9010945.html 题目传送门 - Codechef STMINCUT 题意 在一个有边权的无向图中,我们定义 ...
- 关于用舞蹈链DLX算法求解数独的解析
欢迎访问——该文出处-博客园-zhouzhendong 去博客园看该文章--传送门 描述 在做DLX算法题中,经常会做到数独类型的题目,那么,如何求解数独类型的题目?其实,学了数独的构建方法,那么DL ...
- DateFormat抽象类实现日期与字符串的转换
[需求]日期是可以计算的,而日期字符串无法计算. 由于DateFormat是抽象类,我们一般都是用的它的子类SimpleDateFormat. [SimpleDateFormat构造方法] 1)Sim ...