共享CUDA内存

吴建明wujianming 2024-11-09 14:41:39 原文

共享CUDA内存

进程间共享

此功能仅限于Linux。

将设备阵列导出到另一个进程

使用CUDA IPC API，可以与同一台计算机上的另一个进程共享设备阵列。为此，请使用.get_ipc_handle()设备阵列上的方法获取一个IpcArrayHandle对象，该对象可以转移到另一个进程。

DeviceNDArray.get_ipc_handle（）

返回一个IpcArrayHandle对象，该对象可以安全地序列化并传输到另一个进程以共享本地分配。

注意：此功能仅在Linux上可用。

类numba.cuda.cudadrv.devicearray.IpcArrayHandle（ipc_handle，array_desc ）

IPC阵列句柄可以序列化并转移到同一台计算机上的另一个进程，以共享GPU分配。

在目标进程上，使用.open（）方法创建一个新的 DeviceNDArray对象，该对象共享来自原始进程的分配。要释放资源，请调用.close（）方法。此后，目标将无法再使用共享数组对象。（注意：对资源的底层weakref现在已失效。）

该对象实现了上下文管理器接口，该接口自动调用 .open（）和.close（）方法：

with the_ipc_array_handle as ipc_array:

    # use ipc_array here as a normal gpu array object

    some_code(ipc_array)

# ipc_array is dead at this point

close（）

关闭阵列的IPC句柄。

open（）

返回一个共享原始进程分配的新DeviceNDArray。不得在原始过程中使用。

从另一个进程导入IPC内存

以下函数用于从另一个进程作为设备阵列打开IPC句柄。

cuda.open_ipc_array（shape，dtype，strides = None，offset = 0 ）

一个上下文管理器，它打开一个IPC句柄（CUipcMemHandle），该句柄表示为一个字节序列（例如，字节，int元组），并将其表示为给定形状，步幅和dtype的数组，步幅可以省略。在那种情况下，假定它是一维C连续数组。

产生一个设备阵列。

上下文管理器退出时，IPC句柄将自动关闭。

共享CUDA内存的更多相关文章

CUDA 内存统一分析
CUDA 内存统一分析关于CUDA 编程的基本知识,如何编写一个简单的程序,在内存中分配两个可供 GPU 访问的数字数组,然后将它们加在 GPU 上. 本文介绍内存统一,这使得分配和访问系统中任何处 ...
clients（PV操作共享内核内存进行输入输出分屏） - server（进程间通信）模型实现
1.拓扑结构 2.PV操作共享内核内存进行输入输出分屏 (1) int semop(int semid,struct sembuf *sops,size_t nsops): 功能描述操作一个或一组信 ...
CUDA学习笔记（三）——CUDA内存
转自:http://blog.sina.com.cn/s/blog_48b9e1f90100fm5f.html 结合lec07_intro_cuda.pptx学习内存类型 CGMA: Compute ...
cuda内存总结
1．shared memory __shared__ 声明为共享内存,将会保存在共享内存中 2．constant memory __constant__ 声明为常量内存,将会保存在常量内存中,常量内 ...
go语言笔记——切片底层本质是共享数组内存！！！绝对不要用指针指向 slice切片本身已经是一个引用类型就是指针
切片切片(slice)是对数组一个连续片段的引用(该数组我们称之为相关数组,通常是匿名的),所以切片是一个引用类型(因此更类似于 C/C++ 中的数组类型,或者 Python 中的 list 类型) ...
CUDA -- 内存分配
CUDA可以认为是一个由软件和硬件构成的并行计算系统,其依赖于GPU的并行计算单元,CUDA有类C的API,方便程序编写.其依赖于CPU和GPU的异构体系,通过在CPU上串行执行环境初始化.内存分配. ...
CUDA内存拷贝
原文链接1.cudaMemcpy()<--> cudaMalloc() //线性内存拷贝 1 //线性内存拷贝 2 cudaMalloc((void**)&dev_A, data ...
布客·ApacheCN 翻译/校对/笔记整理活动进度公告 2020.1
注意请贡献者查看参与方式,然后直接在 ISSUE 中认领. 翻译/校对三个文档就可以申请当负责人,我们会把你拉进合伙人群.翻译/校对五个文档的贡献者,可以申请实习证明. 请私聊片刻(52981514 ...
CUDA：共享内存与同步
CUDA C支持共享内存, 将CUDA C关键字__shared__添加到变量声明中,将使这个变量驻留在共享内存中.对在GPU上启动的每个线程块,CUDA C编译器都将创建该变量的一个副本.线程块中的 ...

随机推荐

[源码分析] 并行分布式任务队列 Celery 之 Timer & Heartbeat
[源码分析] 并行分布式任务队列 Celery 之 Timer & Heartbeat 目录 [源码分析] 并行分布式任务队列 Celery 之 Timer & Heartbeat 0 ...
hdu4940 有上下界的无源可行流判断
题意: 给你一个强连通图,然后问你是否可以找到任意满足条件的集合S,S是非空集合,T是S的补集,满足sum(D[i ,j]) <= sum(D[j,i] + B[j,i]) i属于S ...
POJ 2135 简单费用流
题意: 题意是一个人他要从牧场1走到牧场n然后在走回来,每条路径只走一次,问全程的最短路径是多少. 思路: 这个题目挺简单的吧,首先要保证每条边只能走一次,然后还要要求费用最 ...
PowerShell-6.文件操作
1.显示文本内容 Get-Content "°C:\\Program Files (x86)\\PsUpdate\\b.dat" 2.得到b.dat文件内容,然后把里面的所有'C' ...
【vue-01】快速入门
什么是vue vue是渐进式的JavaScript框架什么是渐进式? 你可以在原有大系统的上面,把一两个组件改用vue实现,:也可以整个项目用vue全家桶开发. vue是一个轻量级的MVVM ...
liunx服务器安装jdk
1.官网下载需要版本的jdk,官网地址 http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.h ...
Thinking in UML 笔记（一） -- 面向对象
一.UML 中最重要的就是面向对象. 面向对象的认识论可以构建更为复杂的系统来解释复杂的世界. 1. 面向过程,一切都是相互紧密地联系在一起,互相作用,互相影响. 2.面向对象, 世界是分割开的,只有 ...
Charles的证书下载(web)
1.charles的证书下载(web) 1.为什么下载charles的ssl证书? 默认情况下,charles不能解析https协议的接口,里面的请求和响应数据都是乱码格式,所以我们需要下载ssl证书 ...
copy函数与ostream_iterator、reverse_iterator
#include <iostream> #include <iterator> #include <vector> int main() { using names ...
mysql知识点归纳-锁（死锁）
愿历尽千帆,归来仍是少年所遇问题: MySql 更新死锁问题 Deadlock found when trying to get lock; try restarting transaction 场 ...