1、此次使用torque-5.0.0-1_43d8f09a.tar.gz这个版本http://www.adaptivecomputing.com/downloading/?file=/torque/torque-5.0.0-1_43d8f09a.tar.gz,我所使用的linux系统是centos6.5。将torque源码包下载至linux根目录下的tmp文件夹,tar -xf命令解压。并安装以下编译工具:

yum install libtool-devel libxml2-devel openssl-devel gcc gcc-c++ boost-devel

2、cd命令进入解压后的文件夹torque-5.0.0-1_43d8f09a,切换为root用户,逐次运行下列四条命令:

./configure
make
sudo make install
make packages

最后一条命令会在文件夹内产生下面这些.sh脚本:

torque-package-clients-linux-x86_64.sh
torque-package-devel-linux-x86_64.sh
torque-package-doc-linux-x86_64.sh
torque-package-mom-linux-x86_64.sh
torque-package-server-linux-x86_64.sh

在本机安装脚本:

./torque-package-clients-linux-x86_64.sh --install
./torque-package-mom-linux-x86_64.sh --install

在目录即/tmp/torque-5.0.0-1_43d8f09a下执行:

cp contrib/init.d/pbs_server /etc/init.d/pbs_server
chkconfig --add pbs_server
cp contrib/init.d/pbs_server /etc/init.d/pbs_sched
chkconfig --add pbs_sched
cp contrib/init.d/pbs_server /etc/init.d/trqauthd
chkconfig --add trqauthd

本机即是管理节点也是计算节点:

cp ./contrib/init.d/pbs_mom /etc/init.d/
chkconfig --add pbs_mom
service pbs_mom start
./torque.setup root
qterm -t quick
pbs_server
qstat -q

3、返回linux根目录:

cd /

进入路径:/var/spool/torque/server_priv/

创建nodes文件:

vi nodes

往里面写入内容:localhost.localdomain np=1

保存此文件,再reboot命令重启操作系统。

4、Torque主要是由三个主要部件组成:

(1)pbs_server:PBS服务守护进程,负责接收作业提交,位于服务节点上
(2)pbs_sched:PBS调度守护进程,负责调度作业,位于服务节点上 
(3)pbs_mom:PBS守护进程, 负责监控本机并执行作业,位于所有计算节点上

在单计算机环境下,以上三者均运行在本机。

5、明白了4的意思之后就启动torque了:

pbs_server
pbs_sched
pbs_mom
trqauthd

6、启动服务后可以写个脚本run.sh测试一下:

#!/bin/sh

g++ -o test1 test1.cpp
sleep
./test1

可以在本地随便写一个c++代码test1.cpp,然后命令提交脚本至pbs:

qsub ./run.sh

再使用命令qstat查看:

qstat -a

7、pbs常用命令汇总:

qsub提交作业、qstat查看已投运作业的情况、qdel删除作业、pnodes查看计算节点资源;
交互模式提交作业,qsub -I;在交互模式中转发图形界面,适用于画图、有图形界面的软件,qsub -I -X;
查看作业运行的节点,qstat -n;查看系统作业队列划分情况(每个队列包含的节点、用户控制),qstat -Qf;
pbs作业脚本常用格式:

#PBS -N python_cos_work
#PBS -l nodes=:ppn=
#PBS -l mem=2G
#PBS -l walltime=::
#PBS -q batch
#PBS -V cd /home/tuzhuo/code/git/pycode/rs
python cos.py

pnodes命令查看系统资源,根据系统可用的CPU资源,为自己的作业合理申请资源;

tz@croplab,HZAU

2019/7/26

【Linux】单计算机安装PBS系统(Torque)与运维的更多相关文章

  1. 老司机实战Windows Server Docker:3 单节点Windows Docker服务器简单运维(上)

    经过上两篇实战Windows Server Docker系列文章,大家对安装Windows Docker服务以及如何打包现有IIS应用为docker镜像已经有了基本认识.接下来我们来简单讲讲一些最基本 ...

  2. 老司机实战Windows Server Docker:4 单节点Windows Docker服务器简单运维(下)

    上篇中,我们主要介绍了使用docker-compose对Windows Docker单服务器进行远程管理,编译和部署镜像,并且设置容器的自动启动.但是,还有一些重要的问题没有解决,这些问题不解决,就完 ...

  3. 未来Linux系统将是运维行业必备的技能之一

    关于linux,这个并不是每个人都能用或者需要用的,因为平时有很多人用电脑只是为了上上网,聊聊天,打打游戏,这个是完全不需要用linux的.关于linux,是不能用正常的大家所熟知的window来认知 ...

  4. linux系统中日常运维常用命令汇总一

    一.查看日志和机器相关信息常用命令 1.cat cat 命令连接文件并打印到标准输出设备上,cat经常用来显示文件的内容,类似于下的type命令注意:当文件较大时,文本在屏幕上迅速闪过(滚屏),用户往 ...

  5. Linux的简单介绍和开发基本运维时候用到的命令

    先简单介绍下Linux文件夹目录 1./ linux下的根目录 实际上等同于window的我的电脑点进去 2./etc /usr 一个是系统配置文件存放的地方,一个是系统资源(应用程序)放的地方这俩文 ...

  6. Linux下Apache(HTTP)基础知识梳理-运维笔记

    HTTP介绍: HTTP协议是Hyper Text Transfer Protocol(超文本传输协议)的缩写,是用于从万维网(WWW:World Wide Web )服务器传输超文本到本地浏览器的传 ...

  7. linux中ftp的安装过程记录[运维篇]

    安装FTP的全过程记录,对于相同情况希望有所帮助.[centOS] 1.查询本机是否安装vsftpd: rpm -qa |grep vsftpd : 2.安装ftp服务 yum install vsf ...

  8. Linux系统下root密码遗忘等系统故障的修复方法 - 运维总结

    IDC机房有一台centos系统的服务器,由于这台服务器的系统装了好长时间,且root密码中间更新过几次,后面去机房现场维护时,登陆密码遗忘了,悲催啊~没办法,只能开机进入“单用户模式”进行密码重置了 ...

  9. Linux 运维入门到跑路书单推荐

    一.基础入门 <鸟哥的Linux私房菜基础学习篇>:最具知名度的Linux入门书<鸟哥的Linux私房菜基础学习篇>,全面而详细地介绍了Linux操作系统. https://b ...

随机推荐

  1. 第三篇 jQuery操作DOM

    3-1 DOM页面文档 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http:/ ...

  2. 客户端相关知识学习(二)之h5与原生app交互的原理

    前言 现在移动端 web 应用,很多时候都需要与原生 app 进行交互.沟通(运行在 webview中),比如微信的 jssdk,通过 window.wx 对象调用一些原生 app 的功能.所以,这次 ...

  3. 21 Python之反射

    1.反射 主要是用到了4个函数(  用的最多的就是getattr()和 hasattr()  ): getattr()   从xxx对象中获取到xxx属性值 hasattr()  判断xxx对象中是否 ...

  4. 18 Python之初识面向对象

    1. 类与对象 class Car: #类名首字母大写,严格遵守驼峰命名规范 pass #造车 c = Car() #类名() #创建对象 ##出场之后进行改装 c.color = "红色& ...

  5. python 定义变量

    定义变量 什么是变量? 在程序运行过程中,其值可以改变的量 标识符(命令规范) 只能由数字.字母.下划线组成 不能以数字开头 不能是系统关键字 # 导入包import keyword​# 打印所有关键 ...

  6. Hadoop网页监控配置

    接之前的内容http://www.cnblogs.com/jourluohua/p/8734406.html 在之前那的内容中,仅实现了Hadoop的安装和运行,距离实际使用还有很远.现在先完成一个小 ...

  7. SpringBoot之使用Druid连接池以及SQL监控和spring监控

    一.引入maven依赖 <dependencies> <dependency> <groupId>org.springframework.boot</grou ...

  8. 错误信息 NSError

    一.获取系统的错误信息 比如移动文件时,获取文件操作错误: NSError *e = nil;[[NSFileManager defaultManager] moveItemAtPath:source ...

  9. c++ easyX的学习

    画象棋盘来浅显学习了解easyx 了解象棋盘的构成: 如图就为一个基本的象棋棋盘我们下面就用esayx来画出这个棋盘,我的感觉这个棋盘大概分为两个部分:第一部分就是棋盘的大致布局,第二个就是棋盘的细节 ...

  10. Redis位操作介绍

    在学习redis的过程了,看到了redis还能用于大数据处理,具体场景如下:腾讯10亿用户,要几个毫秒内查询到某个用户是否在线,你能怎么做?千万别说给每个用户建立一个key,然后挨个记(你可以算一下需 ...