MVAPICH
from:https://developer.nvidia.com/mvapich
MVAPICH2 is an open source implementation of Message Passing Interface (MPI) that delivers the best performance, scalability and fault tolerance for high-end computing systems and servers using InfiniBand, 10GigE/iWARP and RoCE networking technologies. MVAPICH2 simplifies the task of porting MPI applications to run on clusters with NVIDIA GPUs by supporting standard MPI calls from GPU device memory. It optimizes the data movement between host and GPU, and between GPUs in the best way possible while requiring minimal or no effort from the application developer.
MVAPICH2是一个开源的MPI系统,其对使用InfiniBand(无线带宽技术)的高端计算系统和服务器提供高性能、可适应性、容错性,是一种具有10GigE/iWARP速度,RoCE网络的技术。
MVAPICH2简化MPI应用程序移植到与NVIDIA GPU集群上运行,并支持标准的MPI调用GPU设备内存的任务。它以最佳方式优化了主机和GPU之间、GPU和GPU之间的数据移动,而应用程序开发人员角度只需付出很少的努力,甚至不需要。 MVAPICH2以为使用Infiniband,10GigE/iWARP,ROCE网络的高性能集群提供优秀的可扩展性和容错著称。
Key Features:
High performance RDMA-based inter-node MPI point-to-point communication from/to GPU device memory (GPU-GPU, GPU-Host and Host-GPU)
- High performance intra-node MPI point-to-point communication for multi-GPU adapters/node (GPU-GPU, GPU-Host and Host-GPU)
- Optimized and tuned MPI collective communication from/to GPU device memory
- MPI Datatype support in point-to-point and collective communication from/to GPU device memory
- Taking advantage of CUDA IPC (available in CUDA 4.1) in intra-node communication for multiple GPU adapters/node
- Efficient synchronization mechanism using CUDA Events for pipelined data transfers from/to GPU device memory
主要特点:
- 高性能的基于RDMA的节点间的MPI点至点通信(GPU-GPU,GPU-Host,Host-GPU)
- 高性能节点内的MPI点至点的多GPU通信(GPU-GPU,GPU-Host,Host-GPU)
- 优化和调整 GPU设备内存的MPI集体通信
- MPI的数据类型的支持GPU设备内存的点至点和集体通信
- 节点多GPU卡内通信使用了CUDA IPC(CUDA4.1 支持 IPC)
- 使用CUDA事件为流水线数据的内存数据GPU传输的高效同步机制
Performance:
The latest performance results using MVAPICH2 for MPI communication from/to/between GPU devices can be found on the OSU Microbenchmark Page for GPUs
Availability:
The latest version of MVAPICH2 can be downloaded from: http://mvapich.cse.ohio-state.edu/download/mvapich2/ NVIDIA GPU related features are available in MVAPICH2 releases starting from 1.8.
MVAPICH Project Page:
http://mvapich.cse.ohio-state.edu/overview/mvapich2/features.shtml
MVAPICH的更多相关文章
- Mellanox OFED2.1-X安装记录
---恢复内容开始--- 1,tcl,tk,gcc-gfortran,libnl-devel依赖包
- 分布式计算课程补充笔记 part 2
▶ 并行计算八字原则:负载均衡,通信极小 ▶ 并行计算基本形式:主从并行.流水线并行.工作池并行.功能分解.区域分解.递归分治 ▶ MPI 主要理念:进程 (process):无共享存储:显式消息传递 ...
- [转帖] InfiniBand主流厂商和产品分析
https://blog.csdn.net/swingwang/article/details/72935461 InfiniBand主流厂商和产品分析 2017年06月08日 22:03:46 Ha ...
- [转帖]InfiniBand 主流厂商 和 产品分析
InfiniBand 主流厂商 和 产品分析 Mellanox成立于1999年,总部设在美国加州和以色列,Mellanox公司是服务器和存储端到端连接InfiniBand解决方案的领先供应商.20 ...
- software collection
software software Table of Contents 1. Privacy 2. GFW 2.1. google search 2.2. 修改 DNS 服务器 2.2.1. 修改ip ...
- 基于CentOS的IB网卡驱动安装
一.准备步骤 1.查看centos版本 cat /etc/issue或者cat /etc/redhat-release 2.查看linux版本 cat /proc/version或uname -a或 ...
- 基于infiniband(IB)网的MVAPICH2安装
一.下载安装包 下载链接:http://mvapich.cse.ohio-state.edu/downloads/ 二.解压编译安装 mkdir /home/xujb/mvapich2 tar -x ...
随机推荐
- linux在命令符界面如何浏览网页
1.介绍 w3m是个开放源代码的命令行下面的网页浏览器. 它支持表格.框架.SSL连线.颜色.如果是在适当的terminal上,甚至还支持"inline image". 这个软件通 ...
- CSS3 中 图标编码 icon——Font-Awesome
在做网页开发中经常会用到图标,原来经常会到一些icon网站上找导入到项目中,现在Font-Awesome中的有很多的图标,并且还在不断更新 现在Font-Awesome最新版本是4.7,下载出来的Fo ...
- 使用codesmith无法连接mysql问题
最近研究codesmith的用法,遇到了如题的问题,记录一下解决的方法. 1.问题描述: 在codesmith中选择MySQLSchemaProvider并连接数据库时,会报以下错误: Test fa ...
- Web测试相关内容
Q-1. Web测试的范围是什么? 答. Web测试是软件测试的名称,专注于测试基于Web的应用程序. 在进入生产环境之前,测试团队会对Web应用程序进行详尽的测试. 这有助于发现应用程序中的不同问题 ...
- jQuery 3 有哪些新东西
jQuery 的横空出世,至今已有十个年头了,而它的长盛不衰显然不是没有理由的.jQuery 提供了极为友好的接口,使得开发者们可以方便地进行 DOM 操作.发起 Ajax 请求.生成动画……不一而足 ...
- 前端如何做好SEO优化
https://www.cnblogs.com/weiyf/p/9511021.html 一:什么是SEO? 搜索引擎优化(Search Engine Optimization),简称SEO.是按照搜 ...
- asp.net core 2.1 生成swagger文档
新建asp.netcore2.1 api项目 “WebApplication1” 在nuget管理器中添加对Swashbuckle.AspNetCore 3.0.0.Microsoft.AspNetC ...
- 资源管理与调度系统-YARN的基本架构与原理
资源管理与调度系统-YARN的基本架构与原理 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. 为了能够对集群中的资源进行统一管理和调度,Hadoop2.0引入了数据操作系统YARN. ...
- Cloud Computing
More numbers, More power. We waste much more every day. Everything can be connectible through specia ...
- python列表生成式、列表推导式
运用列表生成式,可以快速生成list,可以通过一个list推导出另一个list,而代码却十分简洁. 格式 [x for x in 内容] [x for x in 内容 if 条件] 1:要把生成的元素 ...