CUDA学习（三）之使用GPU进行两个数相加

在CPU上定义两个数并赋值，然后使用GPU核函数将两个数相加并返回到CPU，在CPU上显示

#include "cuda_runtime.h"

#include "device_launch_parameters.h"

#include <iomanip>

#include <iostream>

#include <stdio.h>

using namespace std;

//检测GPU

bool CheckCUDA(void){

    int count = ;

    int i = ;

    cudaGetDeviceCount(&count);

    if (count == ) {

        printf("找不到支持CUDA的设备!\n");

        return false;

    }

    cudaDeviceProp prop;

    for (i = ; i < count; i++) {

        if (cudaGetDeviceProperties(&prop, i) == cudaSuccess) {

            if (prop.major >= ) {

                break;

            }

        }

    }

    if (i == count) {

        printf("找不到支持CUDA的设备!\n");

        return false;

    }

    cudaGetDeviceProperties(&prop, );

    printf("GPU is: %s\n", prop.name);

    cudaSetDevice();

    printf("CUDA initialized success.\n");

    return true;

}

//使用指针相加

__global__ void addNumber(double a, double b, double *c);

int main(){

    //检测GPU

    if (!CheckCUDA()){

        cout << "No CUDA device.";

        return ;

    }

    cout << "*************************************************************************************************************" << endl;

    double h_a, h_b, h_c;       //在CPU上定义三个变量

    double *d_c;           //定义一个将指向GPU的指针

    h_a = 2.2;

    h_b = 3.3;

    cudaMalloc((void **)&d_c, sizeof(double));     //为指针在GPU上分配内存空间
　　 //调用核函数并启用一个线程块和一个线程

    addNumber<<<, >>>(h_a, h_b, d_c);            //只是单独的两个数相加，不是两个数组相加，只需使用单线程，数组相加可以使用多线程

    cudaMemcpy(&h_c, d_c, sizeof(double), cudaMemcpyDeviceToHost);    //将GPU上计算好的结果返回到CPU上定义好的变量

    //setw(10)表示输出10个空格，需添加 #include <iomanip>

    cout << setw() << h_a << " + " << h_b << " = " << h_c << endl;  

    cout << endl << endl;

    system("pause");

    return ;

}

__global__ void addNumber(double a, double b, double *c){

    *c = a + b;

}

显示结果如下

CUDA学习（三）之使用GPU进行两个数相加的更多相关文章

在O(N)时间内求解正数数组中两个数相加的最大值
一,问题描述给定一个正数数组arr(即数组元素全是正数),找出该数组中,两个元素相加的最大值,其中被加数的下标大于加数的下标.由加法运算的可逆性,j >i 这个条件可以去掉. 即求出: max ...
【LeetCode-面试算法经典-Java实现】【002-Add Two Numbers (单链表表示的两个数相加)】
[002-Add Two Numbers (单链表表示的两个数相加)] 原题 You are given two linked lists representing two non-negative ...
牛客网2016.4.11（两个数相加为sum/计数一个int型的二进制有多少个1/二叉树是否左右对称）
求最小的两个数相加为sum //求最小的两个数相加为sum public ArrayList<Integer> FindNumbersWithSum(int [] array,int su ...
作业帮：给定一个整数数组，找出其中两个数相加等于目标值（去重set）
题目描述给定一个整数数组,找出其中两个数相加等于目标值输入 [1,3,5,7,9,11] 10 输出 1,9 3,7 代码: import java.util.HashMap; import ja ...
【剑指offer学习】求和为定值的两个数（拓展）
接着上面一篇文章: http://blog.csdn.net/u013476464/article/details/40651451 接下来我们拓展一下题目,如果数组是乱序的,并且规定数组中的元素所有 ...
【LeetCode】两个数相加
[问题]给定两个非空链表来表示两个非负整数.位数按照逆序方式存储,它们的每个节点只存储单个数字.将两数相加返回一个新的链表. 你可以假设除了数字 0 之外,这两个数字都不会以零开头. [实例] 输入: ...
php不用第三个变量，交换两个数的值
//字符串版本结合使用substr,strlen两个方法实现 $a="a"; $b="b"; echo '交换前 $a:'.$a.',$b:'.$b.'< ...
Flex学习第一天(两个数相加)
<?xml version="1.0" encoding="utf-8"?><s:Application xmlns:fx="htt ...
剑指offer用位运算实现两个数相加，及python相关的位操作
题目:写一个函数,求两个整数之和,要求在函数体内不得使用+.-.*./四则运算符号. 代码: # -*- coding:utf-8 -*-class Solution: def Add(self ...

随机推荐

Kafka 集群在马蜂窝大数据平台的优化与应用扩展
马蜂窝技术原创文章,更多干货请订阅公众号:mfwtech Kafka 是当下热门的消息队列中间件,它可以实时地处理海量数据,具备高吞吐.低延时等特性及可靠的消息异步传递机制,可以很好地解决不同系统间数 ...
无聊读论文：视觉注意力模型RARE2012
Riche, N., Mancas, M., Duvinage, M., Mibulumukini, M., Gosselin, B., & Dutoit, T. (2013). RARE20 ...
设置文本框的 placeholder 的颜色
使用方法: 选择器类型::-webkit-input-placeholder input::-webkit-input-placeholder{ color:rgba(144,147,153,1); ...
MySQL之插入数据（添加数据）-INSERT
基本语法: INSERT 语句有两种语法形式,分别是 INSERT…VALUES 语句和 INSERT…SET 语句. 1.INSERT...VLAUES语句 INSERT VLAUES的语法格式如下 ...
electron-vue 设置cookie
//设置登录cookie setCookie(name,value){ var Days=30; var exp=new Date(); var date=Math.round(exp.getTime ...
竹马竹马chikuma
[问题描述] 众所周知,zzh 和 heyi 是一对竹马竹马,他们从小一起学 C++,最后都成了著名的神犇.而时间回溯到他们童年,这天 zzh 邀请 heyi 来参加 zzh 举行的男性家庭聚会. 而 ...
四、JVM之栈与栈帧
栈: 1.又名堆栈,它是一种运算受限的线性表.其限制是仅允许在表的一端进行插入和删除运算.这一端被称为栈顶,相对地,把另一端称为栈底.其特性是先进后出. 2.栈是线程私有的,生命周期跟线程相同,当创 ...
dp - 循环数组的最大和
首尾相连数组的最大子数组和时间限制:1000 ms | 内存限制:65535 KB 难度:4 描述给定一个由N个整数元素组成的数组arr,数组中有正数也有负数,这个数组不是一般的数组,其首尾是 ...
重载运算符-operator
先看段代码: struct node { friend bool operator< (node n1, node n2){ // 优先取最小的,它与下面的 // 是等价的 return n1. ...
华为，小米部分机型微信浏览器rem不适配的解决方案
针对近日华为,小米的部分机型,在升级系统或升级微信之后,微信内置浏览器产生的rem不能正确填充满的问题,有如下解决方案目前来看,产生这个情况的原因是因为给html附font-size时,附上的fon ...

CUDA学习（三）之使用GPU进行两个数相加

CUDA学习（三）之使用GPU进行两个数相加的更多相关文章

随机推荐

热门专题