OpenACC 计算圆周率（简单版）

▶ 书上的计算圆周率的简单程序，主要是使用了自定义函数

 #include <stdio.h>

 #include <stdlib.h>

 #include <math.h>

 #include <openacc.h>

 #define N   100

 #pragma acc routine seq

 float ff(const float x)

 {

     return 4.0f / (1.0f + x * x);

 }

 int main()

 {

     const float h = 1.0f / N;

     float sumf = , result;

 #pragma acc parallel loop reduction(+:sumf)

     for (int i = ; i < N; i++)

         sumf += ff(h * (i - 0.5f));

     result = h * sumf;

     printf("\nN = %d, myPi = %f, diff = %e\n", N, result, result / 3.141592653589793238 - );

     //getchar();

     return ;

 }

● 输出结果

D:\Code\OpenACC\OpenACCProject\OpenACCProject>pgcc main.c -acc -Minfo -o main_acc.exe

ff:

     , Generating acc routine seq

         Generating Tesla code

     , FMA (fused multiply-add) instruction(s) generated

main:

     , Accelerator kernel generated

         Generating Tesla code

         , #pragma acc loop gang, vector(100) /* blockIdx.x threadIdx.x */

             Generating reduction(+:sumf)

     , Generating implicit copy(sumf)

D:\Code\OpenACC\OpenACCProject\OpenACCProject>main_acc.exe

launch CUDA kernel  file=D:\Code\OpenACC\OpenACCProject\OpenACCProject\main.c function=main line= device= threadid= num_gangs= num_workers= vector_length= grid= block= shared memory=

launch CUDA kernel  file=D:\Code\OpenACC\OpenACCProject\OpenACCProject\main.c function=main line= device= threadid= num_gangs= num_workers= vector_length= grid= block= shared memory=

N = , myPi = 3.161500, diff = 6.336546e-03

PGI: "acc_shutdown" not detected, performance results might be incomplete.

 Please add the call "acc_shutdown(acc_device_nvidia)" to the end of your application to ensure that the performance results are complete.

Accelerator Kernel Timing data

D:\Code\OpenACC\OpenACCProject\OpenACCProject\main.c

  main  NVIDIA  devicenum=

    time(us):

    : compute region reached  time

        : kernel launched  time

            grid: []  block: []

            elapsed time(us): total= max= min= avg=

        : reduction kernel launched  time

            grid: []  block: []

             device time(us): total= max= min= avg=

    : data region reached  times

        : data copyin transfers:

             device time(us): total= max= min= avg=

        : data copyout transfers:

             device time(us): total= max= min= avg=

OpenACC 计算圆周率（简单版）的更多相关文章

用Tcl/Tk脚本计算圆周率
读了阮一峰的蒙特卡罗方法入门,用概率统计的方式求解棘手的数学问题还挺有意思的,尤其是利用正方形和它的内切圆之间的面积关系来建模求解圆周率的方法精巧又简单,比投针实验好理解也好实现多了.建模可不是M ...
红警大战JAVA简单版
代码结构: 相关源码: 武器类: 属性:武器,攻击力,子弹数量. 方法:给属性赋值(set属性()方法) 获取属性值(get属性()方法) package 红警大战简单版; public class ...
运行Spark提供的计算圆周率的示例程序
1.启动Spark服务因为spark是依赖于hadoop提供的分布式文件系统的,所以在启动spark之前,先确保hadoop在正常运行. 在hadoop正常运行的情况下,在master(也就是had ...
模板】AC自动机（简单版）
模板]AC自动机(简单版) https://www.luogu.org/problemnew/show/P3808 这是一道简单的AC自动机模板题. 用于检测正确性以及算法常数. 为了防止卡OJ,在保 ...
拦截导弹简单版（读入一串整数时getline（cin,s） stringstream is(s);）
拦截导弹简单版时间限制: 1 Sec 内存限制: 128 MB提交: 40 解决: 16[提交][状态][讨论版][命题人:外部导入] 题目描述某国为了防御敌国的导弹袭击,发展出一种导弹拦截系 ...
蒙特卡洛方法计算圆周率的三种实现-MPI openmp pthread
蒙特卡洛方法实现计算圆周率的方法比较简单,其思想是假设我们向一个正方形的标靶上随机投掷飞镖,靶心在正中央,标靶的长和宽都是2 英尺.同时假设有一个圆与标靶内切.圆的半径是1英尺,面积是π平方英尺.如果 ...
动手写一个简单版的谷歌TPU-矩阵乘法和卷积
谷歌TPU是一个设计良好的矩阵计算加速单元,可以很好的加速神经网络的计算.本系列文章将利用公开的TPU V1相关资料,对其进行一定的简化.推测和修改,来实际编写一个简单版本的谷歌TPU.计划实现到行为 ...
动手写一个简单版的谷歌TPU-指令集
系列目录谷歌TPU概述和简化基本单元-矩阵乘法阵列基本单元-归一化和池化(待发布) TPU中的指令集 SimpleTPU实例: (计划中) 拓展 TPU的边界(规划中) 重新审视深度神经网络中的 ...
Jquery实现图片瀑布流思路-简单版
目录 Jquery实现图片瀑布流思路-简单版 1.预备 2.开始 1.声明 2.主体 3.窗体大小改变事件 Jquery实现图片瀑布流思路-简单版注意:本篇文章基于知道每张图片的实际尺寸的情况下特 ...

随机推荐

JQuery 基本知识，选择器，事件，DOM操作
一.基本知识 Jquery是什么? 它就是一套JS方法包,jQuery是一个快速,小巧,功能丰富的JavaScript库.它使得HTML文档遍历和操作,事件处理,动画和Ajax更容易使用易于使用的AP ...
Heap Operations 优先队列
Petya has recently learned data structure named "Binary heap". The heap he is now operatin ...
codeforces 724c Ray Tracing
好题原题: There are k sensors located in the rectangular room of size n × m meters. The i-th sensor is ...
LG3812 【模板】线性基
题意给定n个整数(数字可能重复),求在这些数中选取任意个,使得他们的异或和最大. \(1≤n≤50,0≤S_i≤2^{50}\) 分析模板题. 推荐一篇好博客现在我来证明一下线性基的性质. 性质 ...
剑指offer-青蛙变态跳台阶-全概率公式
pthread中errors.h的代码
#ifndef __errors_h #define __errors_h #include <unistd.h> #include <errno.h> #include &l ...
Java8 lam。。。表达式
双冒号:相当于用了别人实现的方法,格式,类名::方法 Math::max等效于(a, b)->Math.max(a, b)String::startWith等效于(s1, s2)->s1. ...
win10禁用自动更新服务
win10禁用自动更新服务按Win+R,打开运行,输入"services.msc"打开服务: 找到"Windows Update",选择属性,修改为禁用即可: ...
grep和egrep正则表达式
Linux上文本处理三剑客 grep :文本过滤( 模式:pattern) 工具 grep, egrep, fgrep (不支持正则表达式搜索,但搜索纯文本的数据最快) sed :stream edi ...
msp430学习笔记-时钟及延时函数
引用:http://blog.chinaunix.net/uid-24343357-id-3271380.html MCLK默认时钟源是DCOCLK,SMCLK默认时钟源也是DCOCLK,DCOCLK ...

OpenACC 计算圆周率（简单版）

OpenACC 计算圆周率（简单版）的更多相关文章

随机推荐

热门专题