本文分享自天翼云开发者社区《HPC中常见的调度器介绍》 作者:土豆炒肉丝

在高性能计算(HPC)环境中,调度器是负责管理和分配计算资源(如计算节点、处理器核心、内存等)给待执行任务的重要组件。不同的HPC系统可能使用不同的调度器,根据系统架构和用户需求的不同,调度器有各自的特点和区别。以下是一些常见的HPC调度器及其区别:

1.SLURM(Simple Linux Utility for Resource Management):

SLURM是一个开源的HPC调度器,广泛应用于高校、超算中心等HPC集群。它提供了丰富的功能,包括作业提交、资源分配、优先级管理、任务监控等。SLURM支持多种作业调度策略,如先进先出(FIFO)、公平共享(Fairshare)、优先级调度等。它还支持作业数组,可以一次性提交多个相似的任务。

2、PBS(Portable Batch System):

PBS是另一个流行的HPC调度器,有商业版本PBS Professional和开源版本Open PBS。它具有强大的灵活性和可扩展性,适用于各种规模的HPC环境。PBS支持多种调度策略,如最短作业优先(SJF)、先来先服务(FCFS)、优先级调度等。PBS还可以根据用户和组织的需求进行自定义配置。

3.LSF(Load Sharing Facility):

LSF是一种商业化的HPC调度器,由IBM开发。它在大规模集群中表现出色,支持多种调度算法,如公平调度、资源回收、优先级调度等。LSF还提供了高度可定制的作业调度规则和策略。

4.Torque/Maui:

Torque是一个开源的HPC调度器,Torque源于PBS的分支版本,用于管理和调度计算资源。Maui是一个与Torque配套的作业调度器,它提供了更高/级的作业调度功能。Torque/Maui组合被广泛用于中小规模的HPC集群。

5.Grid Engine:

Grid Engine是一种开源的HPC调度器,可以在分布式计算环境中进行资源管理和作业调度。Grid Engine支持多种调度策略和作业优先级管理。Grid Engine调度器最早由SUN公司开发,Oracle将其收购后,出现了多个分支版本,如Univa Grid Engine、Oracle Grid Engine、Open Grid Schedule等。

这些HPC调度器之间的区别主要体现在以下方面:

1.源VS商业:一些调度器是开源的,免费使用,如SLURM、Open PBS和Torque,而其他调度器是商业化的,需要购买授权,如LSF。

2.功能和灵活性:不同的调度器提供不同的功能和灵活性,某些调度器可能更适合特定类型的HPC环境或应用场景,如PBS在汽车行业大量应用,LSF对EDA软件支持较好,在电子芯片设计行业应用广泛。

3.性能和可扩展性:调度器的性能和可扩展性可能因集群规模和资源管理复杂性而有所不同。

4.配置和管理:调度器的配置和管理过程也可能有所不同,一些调度器可能需要更多的手动设置和维护。

在选择HPC调度器时,需要根据自己的HPC环境和需求来做出合适的选择。无论使用哪种调度器,良好的作业调度和资源管理都是高性能计算集群运行的关键因素。

HPC中常见的调度器介绍的更多相关文章

  1. k8s调度器介绍(调度框架版本)

    从一个pod的创建开始 由kubectl解析创建pod的yaml,发送创建pod请求到APIServer. APIServer首先做权限认证,然后检查信息并把数据存储到ETCD里,创建deployme ...

  2. 关于windows中的任务管理调度器

    windows中的任务管理调度器 任务管理调度器大概就是给windows设置一个任务,同时还可以设置这个任务的执行时间,执行次数等. 这个任务管理调度器是公司培训同事在讲studio中的job可以在s ...

  3. [UE4]Child Widget中的事件调度器

    在Child Widget中新建事件调度器,就会自动在使用该Child Widget的父级界面的事件列表中自动自动出现.功能十分强大.

  4. linux中的周期调度器

    2017-06-27 上篇文章简要介绍了Linux进程调度,以及结合源代码窥探了下CFS的调度实例.但是没有深入内部区分析调度下面的操作,比如就绪队列的维护以及进程时间的更新等.本节就这些问题做深入讨 ...

  5. JVM中常见的垃圾收集器

    垃圾收集机制是 Java 的招牌能力,极大地提高了开发效率.如今,垃圾收集几乎成为现代语言的标配,即使经过如此长时间的发展, Java 的垃圾收集机制仍然在不断的演进中,不同大小的设备.不同特征的应用 ...

  6. Go调度器介绍和容易忽视的问题

    本文记录了本人对Golang调度器的理解和跟踪调度器的方法,特别是一个容易忽略的goroutine执行顺序问题,看了很多篇Golang调度器的文章都没提到这个点,分享出来一起学习,欢迎交流指正. 什么 ...

  7. 云服务器 ECS Linux 系统中常见的日志文件介绍

    云服务器 ECS Linux 系统中,日志文件是非常重要的文件,它们记录了很多系统中重要的事.Linux 系统中常见日志文件概述如下: /var/log/cron可以在 cron 文件中检查 cron ...

  8. Android 中常见控件的介绍和使用

    1 TextView文本框 1.1 TextView类的结构 TextView 是用于显示字符串的组件,对于用户来说就是屏幕中一块用于显示文本的区域.TextView类的层次关系如下: java.la ...

  9. Hadoop的调度器总结

    Hadoop的调度器总结 随着MapReduce的流行,其开源实现Hadoop也变得越来越受推崇.在Hadoop系统中,有一个组件非常重要,那就是调度器,它的作用是将系统中空闲的资源按一定策略分配给作 ...

  10. java定时调度器解决方案分类及特性介绍

    什么是定时调度器? 我们知道程序的运行要么是由事件触发的,而这种事件的触发源头往往是用户通过ui交互操作层层传递过来的:但是我们知道还有另外一种由机器系统时间触发的程序运行场景.大家想想是否遇到或者听 ...

随机推荐

  1. Nuxt.js 应用中的 webpack:compiled 事件钩子

    title: Nuxt.js 应用中的 webpack:compiled 事件钩子 date: 2024/11/23 updated: 2024/11/23 author: cmdragon exce ...

  2. vant+vue控制列表展开

    <van-list v-model="loading" :finished="finished" finished-text="没有更多了&qu ...

  3. dotnet学习笔记-专题01-异步与多线程-01

    专题01 异步 多线程 1. Thread类 1.1 使用Thread创建线程 namespace ConsoleApp1; internal class Program { private stat ...

  4. datagridview点击列头对当前列进行排序的功能无效

    DataGridView 的默认行为是支持通过单击列头对列进行排序,但在以下情况下可能会取消该功能或无法使用: 1. 绑定的数据源不支持排序 如果 DataGridView 的数据源是绑定到一个不支持 ...

  5. cajviewer逆向分析与漏洞挖掘

    文章首发于 https://mp.weixin.qq.com/s/7STPL-2nCUKC3LHozN6-zg 前言 CAJViewer是一个论文查看工具,主要用于查看caj文件格式的论文.本文介绍对 ...

  6. ChatGPT接口测试用例生成的流程

    通常,使用ChatGPT生成接口测试用例的流程可以分为以下关键步骤. 收集接口信息 收集接口的相关文档和信息,如接口名称.请求方法.请求参数.返回结果等.这些是ChatGPT生成测试用例需要的输入信息 ...

  7. 【PHP】读取本地文件夹中所有图片并显示

    <? //获取文件夹下的所有文件 $dir_str = ''; $imgType = array('gif','png','jpg','jpeg','bmp'); $handle = opend ...

  8. 【C#】【桌面应用开发】拖拽文件到文本框获得所拖拽文件的路径

    步骤1:设置文本框属性 设置文本框属性,将属性AllowDrop改为True 使其允许拖拽文件 步骤2: 在控件事件管理中双击DragEnter,添加事件 private void Form_sett ...

  9. 【C#】萌狼学习C#那年写的笔记汇总

    目录 习题汇总 例子汇总 报错解决 考前复习 习题汇总 [C#][平时作业]习题-2-数据类型运算符表达式 - 萌狼蓝天 - 博客园 (cnblogs.com) [C#][平时作业]习题-3-数组 ...

  10. 更改linux文件/目录的权限、拥有者及用户组

    在Linux中,创建一个文件时,该文件的拥有者都是创建该文件的用户.该文件用户可以修改该文件的拥有者及用户组,root用户可以修改任何文件的拥有者及用户组. 在Linux中,对于文件的权限(rwx), ...