CUDA npp运动检测模块性能测试
测试环境:
|
Cpu: Intel(R)Core(TM)i7-4790 CPU @3.6GHZ |
|
GPU: NVIDIA GeForce GTX960 *2 |
|
操作系统: Windows 7 专业版 64位操作系统 |
|
内存: 安装内存(RAM) 16.0GB |
|
显存: 4g*2 |
|
测试指标 测试项目 |
单帧耗mean(500P) |
GPU占用率 |
显存占用 Unit:M |
Cpu占用率 |
内存占用 Unit:M |
|
|
1080p |
1 路 |
9.23ms |
98% / 0% |
237 / 0 |
0% |
263 |
|
1080p |
2 路 |
9.05ms |
98% / 98% |
237 / 237 |
0-1% |
528 |
|
1080p |
4 路 |
18ms |
99% / 99% |
389 / 389 |
0-1% |
528 |
|
1080p |
8 路 |
35.5ms |
99% / 99% |
702 / 702 |
0-1% |
529 |
|
1080p |
16路 |
72.5ms |
99% / 99% |
1325 / 1325 |
0-1% |
520 |
|
1080p |
24路 |
109.5ms |
99% / 99% |
2339 /2339 |
0-1% |
522 |
|
720p |
1 路 |
4.27ms |
96% / 0% |
153/0 |
0% |
263 |
|
720p |
2 路 |
4.2ms |
96% / 96% |
153/153 |
0% |
528 |
|
720p |
4 路 |
8ms |
99%/99% |
225/225 |
0-1% |
515 |
|
720p |
8 路 |
16ms |
99%/99% |
370/370 |
0-1% |
519 |
|
720p |
16路 |
32ms |
99%/99% |
661/661 |
0-1% |
520 |
|
720p |
32路 |
65ms |
99%/99% |
1243/1243 |
0-1% |
523 |
|
4cif |
1 路 |
2.1ms |
90%-90% |
121 / 0 |
0-1% |
341 |
|
4cif |
2 路 |
2ms |
91% / 91% |
121 / 121 |
0-1% |
518 |
|
4cif |
4 路 |
3.5ms |
99% / 99% |
162 / 162 |
0-1% |
519 |
|
4cif |
8 路 |
7ms |
99% / 99% |
244 / 244 |
0-1% |
519 |
|
4cif |
16路 |
14ms |
99% / 99% |
408 / 408 |
0-1% |
521 |
|
4cif |
32路 |
28.5ms |
96% / 96% |
737 / 737 |
0-1% |
524 |
|
4cif |
64路 |
102ms |
55% / 55% |
1394 / 1394 |
0-1% |
529 |
注: 1. 上述测试的每一路对应主机程序的一个线程。
2. 上述的所有测试不考虑主机和内存之间的数据拷贝,单纯的测试GPU的计算能力
所以cpu基本处于空闲状态。
分析:1. 随着主机线程数目的增多,线程之间的调度时间延时会导致GPU占用率下降
2. 比较此前测试的GTX760显卡, GTX960的计算能力略弱,但多线程能力稍强。
CUDA npp运动检测模块性能测试的更多相关文章
- tcmalloc jemalloc glibc内存分配管理模块性能测试对比
tcmalloc是谷歌提供的内存分配管理模块 jemalloc是FreeBSD提供的内存分配管理模块 glibc是Linux提供的内存分配管理模块 并发16个线程,分配压测3次,每次压15分钟,可以看 ...
- cuda npp库旋转图片
#include <stdio.h> #include <stdlib.h> #include <string.h> #include <assert.h&g ...
- STM32驱动MPU6050
轴 MEMS轴 MEMS 加速度计,以及一个可扩展的数字运动处理器 DMP(Digital Motion Processor),可用 I2C 接口连接一个第三方的数字传感器,比如磁力计.扩展之后就可以 ...
- [ZZ] [精彩盘点] TesterHome 社区 2018年 度精华帖
原文地址: https://testerhome.com/topics/17646 相逢即是缘分,总有一篇适合您! 感觉好的请点赞收藏 ,感觉分类不严谨的,欢迎反馈给我! 测试方法&测试管理 ...
- 这一年多来,阿里Blink测试体系如何从0走向成熟?
引言 Apache Flink是面向数据流处理和批处理的分布式开源计算框架,2016年阿里巴巴引入Flink框架,改造为Blink.2017年,阿里整合了所有流计算产品,决定以Blink引擎为基础,打 ...
- 《AngularJS深度剖析与最佳实践》笔记: 第二章 概念介绍
第二章 概念介绍 2.1 什么是UI? 用户界面包括内容(静态信息+动态信息), 外观, 交互. 在前端技术栈中分别由HTML, CSS和JS负责. 进一步抽象, 分别对应于MVC三个主要部分: Mo ...
- blink测试技术介绍
引言: flink是面向数据流处理和批处理的分布式开源计算框架.2016年阿里巴巴引入flink框架,改造为blink,将其运用到搜索及推荐的离线实时计算中,成功解决了搜索.推荐实时大数据量计算的痛点 ...
- 面试题____pthon__002(法本_) 阿里
1.描述一下您负责的业务中最复杂的业务(可以从业务是为了解决用户的什么问题切入).这个最复杂的业务中,最复杂的模块是什么,这个模块的主要功能详细描述一下.这个模块,采用了什么样的测试手段保障质量?2. ...
- 阿里云 RTC QoS 屏幕共享弱网优化之若干编码器相关优化
屏幕共享是视频会议中使用频率最高的功能之一,但在实际场景中用户所处网络环境复杂,常遇到丢包或者拥塞的情况,所以如何优化弱网环境下的用户体验也成为了音视频通信中重要的一环.本文主要分享阿里云 RTC Q ...
随机推荐
- 对微服务API服务网关的理解
目录微服务专栏地址目录1. 简介2. 什么是API网关3. 为什么需要API网关4. API网关在微服务架构体系中处于什么位置4.1 调用者眼中的API网关4.2 所处的位置5. 网关技术实现有哪些6 ...
- SVN同步版本库与网站目录
如何创建SVN版本库及同步文件到WEB目录 来源:空谷 一 安装与配置SVN 1.安装subversion centos: yum install subversion ubuntu: apt-get ...
- Android开发中需要注意哪些坑
作为一个有两.三年Android应用开发经验的码农,自然会遇到很多坑,下面是我能够想起的一些坑(实践证明不记笔记可不是个好习惯),后面有想到其它坑会陆续补上. 1.在Android library中不 ...
- 170301、使用Spring AOP实现MySQL数据库读写分离案例分析
使用Spring AOP实现MySQL数据库读写分离案例分析 原创 2016-12-29 徐刘根 Java后端技术 一.前言 分布式环境下数据库的读写分离策略是解决数据库读写性能瓶颈的一个关键解决方案 ...
- hdu-5465-二维BIT+nim
Clarke and puzzle Time Limit: 4000/2000 MS (Java/Others) Memory Limit: 65536/65536 K (Java/Others ...
- CoderForce 148D-Bag of mice (概率DP求概率)
题目大意:美女与野兽在玩画鸽子的游戏.鸽子在用黑布遮住的笼子里,白色的有w只,黑色的有b只,每次拿出一只作画,谁先画到白色的鸽子谁就赢.美女首先画,因为野兽太丑,它每次画的时候都会吓跑一只鸽子,所有出 ...
- JS-图片控制-动画管理模块
animateManage.js ;(function(window,document,undefined){ var _aniQueue = [], //动画队列 --- ani:动画,Queue: ...
- 快速切题 sgu105. Div 3 数学归纳 数位+整除 难度:0
105. Div 3 time limit per test: 0.25 sec. memory limit per test: 4096 KB There is sequence 1, 12, 12 ...
- OPENWRT常用设置
常用设置: 计划任务,定时重启 系统--计划任务,每行一个计划任务. 然后是计划任务列表的格式: [minute] [hour] [day of month] [month] [day of week ...
- (C/C++学习笔记) 十二. 指针
十二. 指针 ● 基本概念 位系统下为4字节(8位十六进制数),在64位系统下为8字节(16位十六进制数) 进制表示的, 内存地址不占用内存空间 指针本身是一种数据类型, 它可以指向int, char ...