HPC中常见的调度器介绍
本文分享自天翼云开发者社区《HPC中常见的调度器介绍》 作者:土豆炒肉丝
在高性能计算(HPC)环境中,调度器是负责管理和分配计算资源(如计算节点、处理器核心、内存等)给待执行任务的重要组件。不同的HPC系统可能使用不同的调度器,根据系统架构和用户需求的不同,调度器有各自的特点和区别。以下是一些常见的HPC调度器及其区别:
1.SLURM(Simple Linux Utility for Resource Management):
SLURM是一个开源的HPC调度器,广泛应用于高校、超算中心等HPC集群。它提供了丰富的功能,包括作业提交、资源分配、优先级管理、任务监控等。SLURM支持多种作业调度策略,如先进先出(FIFO)、公平共享(Fairshare)、优先级调度等。它还支持作业数组,可以一次性提交多个相似的任务。
2、PBS(Portable Batch System):
PBS是另一个流行的HPC调度器,有商业版本PBS Professional和开源版本Open PBS。它具有强大的灵活性和可扩展性,适用于各种规模的HPC环境。PBS支持多种调度策略,如最短作业优先(SJF)、先来先服务(FCFS)、优先级调度等。PBS还可以根据用户和组织的需求进行自定义配置。
3.LSF(Load Sharing Facility):
LSF是一种商业化的HPC调度器,由IBM开发。它在大规模集群中表现出色,支持多种调度算法,如公平调度、资源回收、优先级调度等。LSF还提供了高度可定制的作业调度规则和策略。
4.Torque/Maui:
Torque是一个开源的HPC调度器,Torque源于PBS的分支版本,用于管理和调度计算资源。Maui是一个与Torque配套的作业调度器,它提供了更高/级的作业调度功能。Torque/Maui组合被广泛用于中小规模的HPC集群。
5.Grid Engine:
Grid Engine是一种开源的HPC调度器,可以在分布式计算环境中进行资源管理和作业调度。Grid Engine支持多种调度策略和作业优先级管理。Grid Engine调度器最早由SUN公司开发,Oracle将其收购后,出现了多个分支版本,如Univa Grid Engine、Oracle Grid Engine、Open Grid Schedule等。
这些HPC调度器之间的区别主要体现在以下方面:
1.开源VS商业:一些调度器是开源的,免费使用,如SLURM、Open PBS和Torque,而其他调度器是商业化的,需要购买授权,如LSF。
2.功能和灵活性:不同的调度器提供不同的功能和灵活性,某些调度器可能更适合特定类型的HPC环境或应用场景,如PBS在汽车行业大量应用,LSF对EDA软件支持较好,在电子芯片设计行业应用广泛。
3.性能和可扩展性:调度器的性能和可扩展性可能因集群规模和资源管理复杂性而有所不同。
4.配置和管理:调度器的配置和管理过程也可能有所不同,一些调度器可能需要更多的手动设置和维护。
在选择HPC调度器时,需要根据自己的HPC环境和需求来做出合适的选择。无论使用哪种调度器,良好的作业调度和资源管理都是高性能计算集群运行的关键因素。
HPC中常见的调度器介绍的更多相关文章
- k8s调度器介绍(调度框架版本)
从一个pod的创建开始 由kubectl解析创建pod的yaml,发送创建pod请求到APIServer. APIServer首先做权限认证,然后检查信息并把数据存储到ETCD里,创建deployme ...
- 关于windows中的任务管理调度器
windows中的任务管理调度器 任务管理调度器大概就是给windows设置一个任务,同时还可以设置这个任务的执行时间,执行次数等. 这个任务管理调度器是公司培训同事在讲studio中的job可以在s ...
- [UE4]Child Widget中的事件调度器
在Child Widget中新建事件调度器,就会自动在使用该Child Widget的父级界面的事件列表中自动自动出现.功能十分强大.
- linux中的周期调度器
2017-06-27 上篇文章简要介绍了Linux进程调度,以及结合源代码窥探了下CFS的调度实例.但是没有深入内部区分析调度下面的操作,比如就绪队列的维护以及进程时间的更新等.本节就这些问题做深入讨 ...
- JVM中常见的垃圾收集器
垃圾收集机制是 Java 的招牌能力,极大地提高了开发效率.如今,垃圾收集几乎成为现代语言的标配,即使经过如此长时间的发展, Java 的垃圾收集机制仍然在不断的演进中,不同大小的设备.不同特征的应用 ...
- Go调度器介绍和容易忽视的问题
本文记录了本人对Golang调度器的理解和跟踪调度器的方法,特别是一个容易忽略的goroutine执行顺序问题,看了很多篇Golang调度器的文章都没提到这个点,分享出来一起学习,欢迎交流指正. 什么 ...
- 云服务器 ECS Linux 系统中常见的日志文件介绍
云服务器 ECS Linux 系统中,日志文件是非常重要的文件,它们记录了很多系统中重要的事.Linux 系统中常见日志文件概述如下: /var/log/cron可以在 cron 文件中检查 cron ...
- Android 中常见控件的介绍和使用
1 TextView文本框 1.1 TextView类的结构 TextView 是用于显示字符串的组件,对于用户来说就是屏幕中一块用于显示文本的区域.TextView类的层次关系如下: java.la ...
- Hadoop的调度器总结
Hadoop的调度器总结 随着MapReduce的流行,其开源实现Hadoop也变得越来越受推崇.在Hadoop系统中,有一个组件非常重要,那就是调度器,它的作用是将系统中空闲的资源按一定策略分配给作 ...
- java定时调度器解决方案分类及特性介绍
什么是定时调度器? 我们知道程序的运行要么是由事件触发的,而这种事件的触发源头往往是用户通过ui交互操作层层传递过来的:但是我们知道还有另外一种由机器系统时间触发的程序运行场景.大家想想是否遇到或者听 ...
随机推荐
- pytorch的四个hook函数
训练神经网络模型有时需要观察模型内部模块的输入输出,或是期望在不修改原始模块结构的情况下调整中间模块的输出,pytorch可以用hook回调函数来实现这一功能.主要使用四个hook注册函数:regis ...
- python argparse变量到class变量的转换代码
github上的项目总喜欢使用argparse + bash来运行,这对于快速运行一个项目来说可能有好处,但在debug的时候是很难受的.因为我们需要在.sh文件中修改传入参数,并且不能使用jupyt ...
- paramiko模块的使用
简介: Paramiko是基于Python(2.7,3.4+)版本实现和封装了SSHv2协议,底层是用cryptography实现,我们如果希望远程登录主机或者远程下载或者上传文件到远程主机都可以使用 ...
- Java反编译器剖析
本文由 ImportNew - 邬柏 翻译自 javacodegeeks.如需转载本文,请先参见文章末尾处的转载要求. Importnew注:如果你也对Java技术翻译分享感兴趣,欢迎加入我们的Jav ...
- 一款.NET开源的Windows资源管理器标签页工具
前言 今天大姚给大家分享一款基于.NET开发的可以让你在Windows资源管理器中使用Tab多标签功能的小工具:QTTabBar. 工具介绍 QTTabBar是一款基于.NET开发的可以让你在Wind ...
- npm depcheck 包依赖检查
1.概述 在前端开发时,如果经常会遇到一些依赖的问题,比如一个项目,之前在 package.json安装了某个包,后来又删除了这个包,但是node_modules 包还是在的,但是我们把代码给其他人安 ...
- json数据对接
1.前言 fastadmin框架本身封装了一系列接口和插件来对表格数据进行管理(新增,编辑,删除),但是其使用的bootstrapTable基于jquery开发,基于某些原因,我们想要使用Vue框架代 ...
- 零基础学习人工智能—Python—Pytorch学习(十一)
前言 本文主要介绍tensorboard的使用. tensorboard是一个可视化的,支持人工智能学习的一个工具. tensorboard的官方地址:https://www.tensorflow.o ...
- Tauri2.0-Vue3OS桌面端os平台|tauri2+vite6+arco电脑版OS管理系统
自研tauri2.x+vite6+vue3+arco.design客户端os管理系统Tauri2ViteOS. vue3-tauri2-os原创跨平台Tauri2.0+Vite6+Pinia2+Arc ...
- 运筹帷幄,质效兼修:源启云原生基础设施管理平台助推企业IT基础资源能效跃迁
导语 数字化大潮席卷,企业需要建设一套能够满足云原生环境下基础资源一体化管理和快速交付的基础设施自动化管理系统,系统需要具备"云上""云下""容器&q ...