sge的简单的应用
1、sge提交脚本qsub
1、qsub work.sh work.sh 不能以数字开头
2、qsub work.sh 默认工作路径为/home/username
3、qsub -cwd work.sh 为当前路径 -wd 为指定路径!
4、qsub -cwd -l vf=*G -q all.q *.sh
-cwd 表示在当前路径下投递,sge的日志会输出到当前路径。
-l vf=*G 任务的预估内存,内存估计的值应稍微大于真实的内存,内存预估偏小可能会导致节点跑挂。
-q 指定要投递到的队列,如果不指定的话,SGE会在用户可使用的队列中选择一个满足要求的队列。
5、qsub -cwd -l vf=*G -l h=node1 *.sh
qsub -cwd -l vf=*G -l h=node1 -P project -q all.q *.sh
qsub –cwd -l h= compute-1-1,vf=nG,p=n <shell script>
投递任务到指定节点(h) 内存(vf) cpu数量(p)P为项目名字
2、查询任务qstat
qstat -f 查看所有任务
qstat -j jobId 按任务id查看
qstat -u user 按用户查看
任务状态:
qw 表示等待状态
Eqw 投递任务出错
r 表示任务正在运行
dr 节点挂了之后,删除任务就会出现这个状态,只有节点重启之后,任务才会消失
3、任务删除qdel
qdel -j 1111 删除任务号为1111的任务
4、其他命令
qrsh 与qsub相比,是交互式的投递任务,注意参数:
-now yes|no 默认设置为yes
若设置为yes,立即调度作业,如果没有可用资源,则拒绝作业,任务投递失败,任务状态为Eqw。
若设置为no,调度时如果没有可用资源,则将作业排入队列,等待调度。
例子: qrsh -l vf=*G -q all.q -now no -w n *sh
qacct 从集群日志中抽取任意账户信息
qalter 更改已提交但正处于暂挂状态的作业的属性
qconf 为集群和队列配置提供用户界面
qhold 阻止已提交作业的执行
qhost 显示SGE执行主机(即各个计算节点)的状态信息
qlogin 启动telnet或类似的登录会话。
5、bash脚本与Linux环境变量
为了防止脚本运行时找不到环境变量,在投递的bash脚本的前面最好加上以下两句话:
#! /bin/bash
#$ -S /bin/bash
6、日志查看
1、sge会产生两个文件一个是test.sheID,一个是test.shoID其中test.sheID为错误文件。test.shoID为记录文件!
调查中.....
7、sge常用命令
Sum Grid Engine常用命令
qacct #从群集日志文件抽取仲裁记录信息
qalter #更改已提交但暂挂的作业的属性
qconf #提供群集配置和队列配置的用户界面
qdel #为用户、操作员或管理员提供向作业或其子集发送信号的方式
qhold #阻止已提交作业的执行
qhost #显示执行主机的状态信息
qlogin #启用telnet或类似的带有自动选择的低负载、适当主机的登录会话
qmake #标准Unix make工具的替代工具。qmake延伸了make的功能,使其能够在一组合适的计算机之间分布一系列的make步骤。
qmod #使拥有者暂停或启用队列。所有与该队列相关的活动的进程也都将得到信号。
qmon #提供 X Windows Motif 命令界面和监视工具。
qresub #通过复制运行的或暂挂的作业创建新作业。
qrls #将作业从之前分配到的留置区域(例如,通过qhold)释放。
qrsh #可用于多种用途,比如以下的情形:
#<1>通过 Grid Engine 系统提供交互式应用程序的远程执行。qrsh 是标准的 Unix 工具 rsh 相比较而言。
#<2>允许提交批处理作业,执行时支持终端 I/O 和终端控制。终端 I/O 包括标准输出、标准错误和标准输入。
#<3>提供一个在批处理作业结束之前保持活动状态的提交客户机。
#<4>允许在 Grid Engine 软件控制下远程执行并行作业任务。
qselect #打印与指定的选择标准对应的队列名称列表。qselect 的输出通常输入到其他的 Grid Engine 系统命令,以便对选定的队列组进行操作。
qsh #在较轻负荷主机的 xterm 中打开交互式 shell 。 在该 shell 中,任何类型的交互式作业都可以运行。
qstat #提供与群集相关的所有作业和队列的状态列表。
qsub #将批处理作业提交到 Grid Engine 系统的用户界面。
qtchsh #完全兼容并可替代从普遍认同并广泛使用的 Unix C Shell(csh) 衍生出来的 tcsh。qtcsh提供的命令shell可以通过 Grid Engine软件透明地将指定应用程序的执行分布到适当且负荷较低的主机上。
###------------------------------------------------------------------------------
qacct -j job_id #查看指定作业的执行信息,不加job_id将显示所有作业信息
qconf -sul #前已配置的 ACL 列表
qconf -sprjl #显示项目列表
qconf -sm #显示 Grid Engine 系统管理人员的列表
qconf -so #显示操作人员列表
qconf -sq #显示队列和队列属性
qconf -sql #显示队列列表
队列属性的详细说明:
qname – 请求的队列名称。
hostlist – 与队列相关联的主机和主机组的列表。
processors – 该队列可以访问的多处理器系统的处理器。(除非必要,否则请不要修改这些参数值。)
qtype – 队列中可以运行的作业类型。当前,作业类型可为批处理或交互式。
slots – 可以和该队列同时执行的作业数。
owner_list – 队列拥有者,在管理人员、操作员和拥有者中有介绍。
user_lists – 用户访问权限列表中列在该参数下的用户或组标识符可以访问该队列。
xuser_lists – 用户访问权限列表中列在该参数下的用户或组标识符不能访问该队列。
project_lists – 列在该参数下的带有项目标识符的提交作业有权访问该队列。
xproject_lists – 列在该参数下的带有项目标识符的提交作业不能访问该队列。
complex_values – 根据提供给队列的特定属性定义集资源属性指定性能。
qconf -sel #显示当前配置为执行主机的所有主机的名称列表
qconf -se hostname #显示指定的执行主机的详细信息
qconf -sh #显示具有管理权限的主机列表
qconf -ss #显示提交主机列表
qconf -sc #显示所配置的资源属性列表
qconf -sconf #显示当前配置
qconf -aprj #添加一个新项目
qconf -sprjl #显示项目列表
qconf -aq queue_name #添加一个队列
qconf -ahgrp @host_group_name #添加主机组,hostlist中主机列表间隔用空格
qconf -mconf #编辑默认Shell【login_shells bash,sh,ksh,csh,tcsh】
qconf -aq #显示默认队列模板
###-----------------------
qsub 参数
-cwd #从当前工作路径运行作业
-wd working_dir #定义工作目录
-o path #定义标准输出文件路径、文件名
-e path #定义标准错误输出文件路径、文件名
-j y[es]|n[o] #定义作业的标准错误输出是否写入到输出文件中
-now y[es]|n[o] #立即执行作业
-a date_time #作业开始运行时间
-b y[es]|n[o] #指定运行程序是二进制文件还是脚本文件,默认n
-m b|e|a|s|n #定义邮件发送规则。b:作业开始时发送。e:作业结束时发送。a:作业失败时发送 s:作业挂起时发送。n:不发送
-M user[@host] #定义邮件地址
-l resource=value #表明作业运行所需要的资源。【-l arch=solaris64,h_vmem=750M,permas=1】
-N job_name #重命名作业名
-q queue_name #定义作业运行队列
-S shell_path #指定运行Shell环境
-P project_name #定义项目名称,前提是存在该项目
-p priority #定义优先级,-1023 到 1024 , 默认值0
-r y[es]|n[o] #定义作业失败后是否重新运行
-v variable #定义环境变量
-dl date_time #定义作业到期时间,在作业到期时间之前,作业的优先级会逐步提高,直到管理员指定的最高级别。
-hold_jid wc_job_list #定义作业的依赖关系,制定作业需要在指定作业正常结束后才可以开始运行。wc_job_list 可以是JOB ID或作业名
-hold_jid_ad wc_job_list #定义阵列作业的依赖关系
-R y[es]|n[o] #定义是否为作业保留资源
-hard #定义作业被调度的硬性要求
sge的简单的应用的更多相关文章
- sge学习 (转)
转自http://biancheng.dnbcw.info/linux/417992.html 命令: qsub - submit a batch job to Grid Engine. qsh ...
- 【造轮子】打造一个简单的万能Excel读写工具
大家工作或者平时是不是经常遇到要读写一些简单格式的Excel? shit!~很蛋疼,因为之前吹牛,就搞了个这东西,还算是挺实用,和大家分享下. 厌烦了每次搞简单类型的Excel读写?不怕~来,喜欢流式 ...
- Fabio 安装和简单使用
Fabio(Go 语言):https://github.com/eBay/fabio Fabio 是一个快速.现代.zero-conf 负载均衡 HTTP(S) 路由器,用于部署 Consul 管理的 ...
- node.js学习(三)简单的node程序&&模块简单使用&&commonJS规范&&深入理解模块原理
一.一个简单的node程序 1.新建一个txt文件 2.修改后缀 修改之后会弹出这个,点击"是" 3.运行test.js 源文件 使用node.js运行之后的. 如果该路径下没有该 ...
- 哪种缓存效果高?开源一个简单的缓存组件j2cache
背景 现在的web系统已经越来越多的应用缓存技术,而且缓存技术确实是能实足的增强系统性能的.我在项目中也开始接触一些缓存的需求. 开始简单的就用jvm(java托管内存)来做缓存,这样对于单个应用服务 ...
- 在Openfire上弄一个简单的推送系统
推送系统 说是推送系统有点大,其实就是一个消息广播功能吧.作用其实也就是由服务端接收到消息然后推送到订阅的客户端. 思路 对于推送最关键的是服务端向客户端发送数据,客户端向服务端订阅自己想要的消息.这 ...
- 我的MYSQL学习心得(一) 简单语法
我的MYSQL学习心得(一) 简单语法 我的MYSQL学习心得(二) 数据类型宽度 我的MYSQL学习心得(三) 查看字段长度 我的MYSQL学习心得(四) 数据类型 我的MYSQL学习心得(五) 运 ...
- 使用 Nodejs 搭建简单的Web服务器
使用Nodejs搭建Web服务器是学习Node.js比较全面的入门教程,因为要完成一个简单的Web服务器,你需要学习Nodejs中几个比较重要的模块,比如:http协议模块.文件系统.url解析模块. ...
- ASP.NET Aries 入门开发教程2:配置出一个简单的列表页面
前言: 朋友们都期待我稳定地工作,但创业公司若要躺下,也非意念可控. 若人生注定了风雨飘摇,那就雨中前行了. 最机开始看聊新的工作机会,欢迎推荐,创业公司也可! 同时,趁着自由时间,抓紧把这系列教程给 ...
随机推荐
- Windows下给PHP安装redis扩展
一.选择适合的版本 二.下载扩展 官网下载地址:http://pecl.php.net/package/redis ,选择合适的版本进行下载 三.解压后将下面两个文件复制到PHP扩展文件目录(ext文 ...
- ES6标准入门 2/26
第一章 ECMAScript6 简介 1.首先经典开头,ECMAScript跟JavaScript的关系,前者是后者的规格,后者是前者的一种实现.在日常场合中,这两个词是可以互换的. 2.ES6可以泛 ...
- PHP fputcsv() 函数
定义和用法 fputcsv() 函数将行格式化为 CSV 并写入一个打开的文件中. 该函数返回写入字符串的长度.如果失败,则返回 FALSE. 语法 fputcsv(file,fields,seper ...
- 4.26 省选模拟赛 T3 状压dp 差分求答案
LINK:T3 比较好的题目 考试的时候被毒瘤的T2给搞的心态爆炸 这道题连正解的思路都没有想到. 一看到题求删除点的最少个 可以使得不连通. 瞬间想到最小割 发现对于10分直接跑最小割即可. 不过想 ...
- CI4框架应用一 - 环境搭建
CI框架 (codeigniter)算是一个古老的框架了,由于在工作中一直在使用这个框架,还是比较有感情的.我对CI的感觉就是,简单易用,学习曲线平滑,对于新手友好. 目前CI框架已经更新到CI4了, ...
- 一个Python爬虫工程师学习养成记
大数据的时代,网络爬虫已经成为了获取数据的一个重要手段. 但要学习好爬虫并没有那么简单.首先知识点和方向实在是太多了,它关系到了计算机网络.编程基础.前端开发.后端开发.App 开发与逆向.网络安全. ...
- LinuX操作系统基础------>初始并安装系统
b了解LinuX操作系统的来历和发展史 掌握虚拟机(Vbox)的安装方法 掌握CentOS6.5的安装方法 操作系统: 操作系统简称OS ,是管理计算机硬件与软件资源的计算机程序,同时也是计算机系统的 ...
- 朴素贝叶斯分类器基本代码 && n折交叉优化
自己也是刚刚入门.. 没脸把自己的代码放上去,先用别人的. 加上自己的解析,挺全面的,希望有用. import re import pandas as pd import numpy as np fr ...
- 在Linux下安装nginx服务器详细教程
首先安装centos的扩展源 yum install epel-release 安装Nginx 方法一: yum install nginx -y 查看版本号,开启nginx,查看进程 nginx – ...
- 安装mpi的那些坑
安装mpi可以用 yum 安装 具体从操作步骤可参考这个链接mpi的yum安装方式 mpi在linux下 使用root权限 会报错 修改方式有两种 1 2.换其他账户 mpi会自行评估我们cpu的 ...