GPU上的图像和信号处理

GPU上的图像和信号处理

NVIDIA Performance Primitives（NPP）库提供GPU加速的图像，视频和信号处理功能，其执行速度比仅CPU实施快30倍。拥有5000多个用于图像和信号处理的原语，可以轻松执行诸如颜色转换，图像压缩，过滤，阈值处理和图像处理之类的任务。

NPP库优化了可用计算资源的使用，因此您的应用程序可在数据中心，工作站和嵌入式平台上实现最佳性能。如今，NPP已被从事自动驾驶汽车，医学成像，机器人技术和HPC的图像处理，信号处理和计算机视觉应用的工程师，科学家和研究人员广泛使用。

高性能

NPP原语针对NVIDIA GPU进行了高度优化，其执行速度比仅CPU替代品快80倍。通过在NVIDIA GPU系列上实现性能最大化，较小内存占用和可用性的试探法，NPP为当今可用的多种学术和商业应用奠定了基础。

主要特点

优化与CPU内存之间的数据传输

处理GPU内存中已经存在的数据
将结果保留在GPU内存中，以便为后续处理做好准备

数据交换与初始化

设置，转换，复制，CopyConstBorder，转置，交换通道

算术和逻辑运算

添加，Sub，Mul，Div，AbsDiff，阈值，比较

颜色转换

RGBToYCbCr，YcbCrToRGB，YCbCrToYCbCr，ColorTwist，LUT_Linear

过滤功能

FilterBox，Filter，FilterRow，FilterColumn，FilterMax，FilterMin，Dilate，Erode，SumWindowColumn，SumWindowRow

JPEG格式

DCTQuantInv，DCTQuantFwd，量化表JPEG

几何变换

镜像，WarpAffine，WarpAffineBack，WarpAffineQuad，WarpPerspective，WarpPerspectiveBack，WarpPerspectiveQuad，调整大小

统计功能

Mean_StdDev，NormDiff，Sum，MinMax，直方图甚至RectStdDev

GPU上的图像和信号处理的更多相关文章

TVM 优化 ARM GPU 上的移动深度学习
TVM 优化 ARM GPU 上的移动深度学习随着深度学习的巨大成功,将深度神经网络部署到移动设备的需求正在迅速增长.与桌面平台上所做的类似,在移动设备中使用 GPU 既有利于推理速度,也有利于能源 ...
TVM在ARM GPU上优化移动深度学习
TVM在ARM GPU上优化移动深度学习随着深度学习的巨大成功,将深度神经网络部署到移动设备的需求正在迅速增长.与在台式机平台上所做的类似,在移动设备中使用GPU可以提高推理速度和能源效率.但是,大 ...
在NVIDIA A100 GPU上利用硬件JPEG解码器和NVIDIA nvJPEG库
在NVIDIA A100 GPU上利用硬件JPEG解码器和NVIDIA nvJPEG库根据调查,普通人产生的1.2万亿张图像可以通过电话或数码相机捕获.这样的图像的存储,尤其是以高分辨率的原始格式, ...
GPU上创建目标检测Pipeline管道
GPU上创建目标检测Pipeline管道 Creating an Object Detection Pipeline for GPUs 今年3月早些时候,展示了retinanet示例,这是一个开源示例 ...
pytorch在CPU和GPU上加载模型
pytorch允许把在GPU上训练的模型加载到CPU上,也允许把在CPU上训练的模型加载到GPU上.CPU->CPU,GPU->GPU torch.load('gen_500000.pkl ...
B/S(WEB)系统中使用Activex插件调用扫描仪实现连续扫描并上传图像(IE文件扫描并自动上传)
IE浏览器下使用Activex插件调用客户端扫描仪扫描文件并山传,可以将纸质档案(如合同.文件.资料等)扫描并将扫描图像保存到服务器,可以用于合同管理.档案管理等. 通过插件方式调用扫描仪扫描并获取图 ...
如何在Web页面里使用高拍仪扫描上传图像
如何在Web页面里使用高拍仪扫描上传图像市场上所有的高拍仪都支持扫描图片并保存到本地,一般公司都会提供控件.开发人员只需要在页面集成就可以进行拍照和扫描.只不过一般扫描的图片是保存在本地固定的文件夹 ...
在GPU上训练数据
在GPU上训练数据模型搬到GPU上数据搬到GPU上损失函数计算搬到GPU上
linux GPU上多个buffer间的同步 —— ww_mutex、dma-fence的使用笔记
原文链接:https://www.cnblogs.com/yaongtime/p/14111134.html WW-Mutexes 在GPU中一次Render可能会涉及到对多个buffer的引 ...

随机推荐

病毒木马查杀实战第017篇：U盘病毒之专杀工具的编写
前言经过前几次的讨论,我们对于这次的U盘病毒已经有了一定的了解,那么这次我们就依据病毒的行为特征,来编写针对于这次U盘病毒的专杀工具. 专杀工具功能说明因为这次是一个U盘病毒,所以我打算把这次的专 ...
ART模式下基于dex2oat脱壳的原理分析
本文博客地址:http://blog.csdn.net/qq1084283172/article/details/78513483 一般情况下,Android Dex文件在加载到内存之前需要先对dex ...
阿里早期Android加固代码的实现分析
本文博客地址:http://blog.csdn.net/qq1084283172/article/details/78320445 看雪上有作者(寒号鸟二代)将阿里移动早期的Android加固进行了逆 ...
Win64 驱动内核编程-26.强制结束进程
强制结束进程依然已经走到驱动这一层了,那么通常结束掉一个进程不是什么难的事情.同时因为win64 位的各种保护,导致大家慢慢的已经不敢HOOK了,当然这指的是产品.作为学习和破解的话当然可以尝试各种 ...
thinkphp之独立日志（tp5.1）
为了便于分析,File类型的日志还支持设置某些级别的日志信息单独文件记录,以error类型的日志为例,例如: 1.在log.php 中配置 'apart_level' => [ 'error' ...
@Scheduled 实现定时任务
@Scheduled注解实现定时任务一.创建一个Springboot项目在启动类里加上@EnableScheduling 二.在写的定时任务的类上加上@Component把该类交由springboo ...
C++入门教程之二：变量
C++入门教程之二:变量变量,顾名思义,意思是变化的量.变量的定义是计算机语言中能储存计算结果或能表示值的抽象概念.一个基本的程序需要变量,因此变量是程序设计中的一大重点. 变量基本结构 var_t ...
【Azure 环境】在Azure虚拟机(经典) 的资源中，使用SDK导出VM列表的办法
Azure, 在2008年10月的Microsoft专业开发人员大会(PDC)上宣布,当时使用内部项目代号"Project Red Dog",并于2010年2月正式发布为Wind ...
java并发编程:深入了解synchronized
简介 synchronized是Java语言的关键字,可用来给对象和方法或者代码块加锁,当它锁定一个方法或者一个代码块的时候,同一时刻最多只有一个线程执行这段代码.同时它还保证了共享变量的内存可见性. ...
Java集合详解（三）：LinkedList原理解析
概述本文是基于jdk8_271源码进行分析的. LinkedList底层是基于链表实现.链表没有长度限制,内存地址不需要固定长度,也不需要是连续的地址来进行存储,只需要通过引用来关联前后元素即可完成 ...

GPU上的图像和信号处理

高性能

GPU上的图像和信号处理的更多相关文章

随机推荐

热门专题