OpenMP 简单的规约

▶ 简单的计算和规约

● 第一种方法，将全局和的指针传入工作函数中进行加和，使用 critical 来控制临界区的访问

 #include <stdio.h>

 #include <stdlib.h>

 #include <omp.h>    

 const int thread = ;

 void work(int* globalSum)

 {

     #pragma omp critical        // 使用 critical 来控制临界区的访问

     *globalSum += omp_get_thread_num();

     return;

 }

 int main(int argc, char* argv[])

 {

     int threadReal, globalSum;

     if (argc >  && *argv[] > ''&& *argv[] < '')

         threadReal = atoi(argv[]);

     else

         threadReal = thread;

     globalSum = ;              // 初始化全局和

     #pragma omp parallel num_threads(threadReal)

     work(&globalSum);           // 将全局和的指针传给每个线程进行计算

     printf("\nglobalSum = %d\n", globalSum);

     getchar();

     return ;

 }

● 输出结果，下面几种方法的输出结果均相同，不再重复罗列

globalSum =

● 第二种方法，使用局部变量，在主函数中进行加和

 #include <stdio.h>

 #include <stdlib.h>

 #include <omp.h>    

 const int thread = ;

 int work()

 {

     return omp_get_thread_num();

 }

 int main(int argc, char* argv[])

 {

     int threadReal, globalSum;

     if (argc >  && *argv[] > ''&& *argv[] < '')

         threadReal = atoi(argv[]);

     else

         threadReal = thread;

     globalSum = ;             

     #pragma omp parallel num_threads(threadReal)

     {

         int localSum = work();  // 使用局部变量

         #pragma omp critical

         globalSum += localSum;  // 将局部和加到全局和中

     }

     printf("\nglobalSum = %d\n", globalSum);

     getchar();

     return ;

 }

● 第三种方法，使用规约子句

 #include <stdio.h>

 #include <stdlib.h>

 #include <omp.h>    

 const int thread = ;

 int work()

 {

     return omp_get_thread_num();

 }

 int main(int argc, char* argv[])

 {

     int threadReal, globalSum;

     if (argc >  && *argv[] > ''&& *argv[] < '')

         threadReal = atoi(argv[]);

     else

         threadReal = thread;

     globalSum = ;            

     #pragma omp parallel num_threads(threadReal) reduction(+ : globalSum)// 要求对 globalSum 使用加法规约

     globalSum += work();

     printf("\nglobalSum = %d\n", globalSum);

     getchar();

     return ;

 }

● 第四种方法，使用 parallel for 循环

 #include <stdio.h>

 #include <stdlib.h>

 #include <omp.h>    

 const int thread = ;

 int work()

 {

     return omp_get_thread_num();

 }

 int main(int argc, char* argv[])

 {

     int i, threadReal, globalSum;

     if (argc >  && *argv[] > ''&& *argv[] < '')

         threadReal = atoi(argv[]);

     else

         threadReal = thread;

     globalSum = ;

     #pragma omp parallel for num_threads(threadReal) reduction(+:globalSum)// 联用了规约子句和 parallel for 循环

     for (i = ; i < threadReal; i++)

         globalSum += work();

     printf("\nglobalSum = %d\n", globalSum);

     getchar();

     return ;

 }

▶ 单独的 parallel for 用法

 #include <stdio.h>

 #include <stdlib.h>

 #include <omp.h>    

 const int thread = ;

 int main(int argc, char* argv[])

 {

     int i, threadReal, a[thread];

     if (argc >  && *argv[] > ''&& *argv[] < '')

         threadReal = atoi(argv[]);

     else

         threadReal = thread;

     #pragma omp parallel for num_threads(threadReal)

     for (i = ; i < threadReal; i++)// 注意，把下面的  a[i] = i 写到括号里来会报错 “OpenMP“for”语句中的增量格式不正确”

         a[i] = i;

     for (i = ; i < thread; i++)

         printf("a[%2d] = %2d\n", i, a[i]);

     getchar();

     return ;

 }

● 输出结果

a[ ] =

a[ ] =

a[ ] =

a[ ] =

a[ ] =

a[ ] =

a[ ] =

a[ ] =

▶ 使用私有变量估计 π 的值

 #include <stdio.h>

 #include <stdlib.h>

 #include <omp.h>    

 const int thread = , count = ;

 int main0(int argc, char* argv[])// 一般方法，使用局部变量

 {

     int i, threadReal;

     double sum;

     if (argc >  && *argv[] > ''&& *argv[] < '')

         threadReal = atoi(argv[]);

     else

         threadReal = thread;

     sum = 0.0;

     #pragma omp parallel for num_threads(threadReal) reduction(+ : sum)

     for (i = ; i < count; i++)

     {

         double sign = (i %  ? -1.0 : 1.0);

         sum += sign / ( * i + );

     }

     printf("π = %.10f\n", sum * );

     getchar();

     return ;

 }

 int main1(int argc, char* argv[])// 将已经声明了的 sign 作为私有变量

 {

     int i, threadReal;

     double sign, sum;

     if (argc >  && *argv[] > ''&& *argv[] < '')

         threadReal = atoi(argv[]);

     else

         threadReal = thread;

     sum = 0.0;

     #pragma omp parallel for num_threads(threadReal) reduction(+ : sum) private(sign)

     for (i = ; i < count; i++)

     {

         sign = (i %  ? -1.0 : 1.0);

         sum += sign / ( * i + );

     }

     printf("π = %.10f\n", sum * );

     getchar();

     return ;

 }

 int main2(int argc, char* argv[])// 使用 default(none) 子句，然后明确规定每个变量的作用域

 {

     int i, threadReal;

     double sign, sum;

     if (argc >  && *argv[] > ''&& *argv[] < '')

         threadReal = atoi(argv[]);

     else

         threadReal = thread;

     sum = 0.0;

     #pragma omp parallel for num_threads(threadReal) reduction(+ : sum) default(none) private(i, sign) shared(count)// 多个变量用逗号隔开

     for (i = ; i < count; i++)

     {

         sign = (i %  ? -1.0 : 1.0);

         sum += sign / ( * i + );

     }

     printf("π = %.10f\n", sum * );

     getchar();

     return ;

 }

● 输出结果

π = 3.1415826536

OpenMP 简单的规约的更多相关文章

基于GCC的openMP学习与测试（2）
一.openMP简单测试 1.简单测试(1) #include<omp.h> #include<time.h> #include<iostream> using n ...
基于GCC的openMP学习与测试
(一).openMP简述 Open Multiprocessing (OpenMP) 框架是一种功能极为强大的规范,可以帮助您利用 C.C++ 和 Fortran 应用程序中的多个核心带来的好处,是基 ...
CUDA01 - 硬件架构、warp调度、指令流水线和cuda并发流
这一部分打算从头记录一下CUDA的编程方法和一些物理架构上的特点:从硬件入手,写一下包括线程束的划分.流水线的调度等等微结构的问题,以及这些物理设备是如何与软件对应的.下一部分会写一下cuda中的几种 ...
应用OpenMP的一个简单的设计模式
小喵的唠叨话:最近很久没写博客了,一是因为之前写的LSoftmax后馈一直没有成功,所以在等作者的源码.二是最近没什么想写的东西.前两天,在预处理图片的时候,发现处理200w张图片,跑了一晚上也才处理 ...
OpenMP的简单使用教程
转自:http://binglispace.com/2015/01/09/openmp-intro/ OpenMP的简单使用教程今天有幸参加了一个XSEDE OpenMP的workshop讲座,真是 ...
并行编程OpenMP基础及简单示例
OpenMP基本概念 OpenMP是一种用于共享内存并行系统的多线程程序设计方案,支持的编程语言包括C.C++和Fortran.OpenMP提供了对并行算法的高层抽象描述,特别适合在多核CPU机器上的 ...
VS2010+OpenMP的简单使用
OpenMP是把程序中的循环操作分给电脑的各个CPU处理器并行进行.比如说我要循环运行100次,我的电脑有两个处理器,那OpenMP就会平均分给两个处理器并行运行,每个处理器运行50次.使用方法 1. ...
基于OpenMP的C++并行编程简单示例
示例要求:在整数A和B之间找到符合条件的值X,使f(X)=C. 示例代码(需要在VS中开启OpenMP支持): #include<iostream> #include<time.h& ...
[OpenMP] 并行计算入门
OpenMP并行计算入门个人理解 OpenMP是一种通过共享内存并行系统的多处理器程序设计的编译处理方案,通过预编译指令告诉编译器哪些代码块需要被并行化,通过拷贝代码块实现并行程序.对于循环的并行化 ...

随机推荐

雷林鹏分享：Ruby 迭代器
Ruby 迭代器迭代器是集合支持的方法.存储一组数据成员的对象称为集合.在 Ruby 中,数组和散列可以称之为集合. 迭代器返回集合的所有元素,一个接着一个.在这里我们将讨论两种迭代器,each 和 ...
Spring4 MVC HelloWorld 注解和JavaConfig实例
在这一节中,我们以 Spring4 MVC HelloWorld 注释/JavaConfig为示例,一步一步以简单的方式学习Spring4 MVC 的注解,项目设置,代码,部署和运行. 在先前的 Sp ...
python语言的优缺点
python作为一门高级编程语言,它的诞生虽然很偶然,但是它得到程序员的喜爱却是必然之路. 龟叔给Python的定位是“优雅”.“明确”.“简单”,所以Python程序看上去总是简单易懂,初学者学Py ...
idea配置echache.xml报错Cannot resolve file 'ehcache.xsd'
解决方法: 打开settings->languages&frameworks->schemas and dtds ,添加地址 http://ehcache.org/ehcache. ...
vue 表单校验一
表单校验一最近使用elment-ui表单进行各种校验,心力交瘁,依旧不能很好地解决,先列出自己的归类,后期一个个攻破表单校验史表单校验准则参考资源 1 2 3 4 5 第一种显示明确的错误 ...
BZOJ3707 圈地
只会O(n ^ 3)路过= = OrzOrzOrzOrzOrz "出题人题解: 显然,这时候暴力枚举会T.于是我们转变一下思路,如果我们确定了2个点以后,第三个点有必要去盲目的枚举吗?答案是 ...
[转载]java正则表达式
转载自:http://butter.iteye.com/blog/1189600 1.正则表达式的知识要点1.正则表达式是什么?正则表达式是一种可以用于模式匹配和替换的强有力的工具.2.正则表达式的优 ...
ViewPager + Fragment 实现主界面底部导航栏
1. 四个类似的Frament布局 tab_main_fragment.xml <LinearLayout xmlns:android="http://schemas.android. ...
HDU2870 最大窗口面积（单调队列优化）
HDU1506 HDU2870 HDU4328 以前做的是单调队列的方法,现在试一试DP 注意的是对于i,向左延伸的L[i]到i不一定是单调的,比如1 3 2 1 2,对于i=4,L[i]=1而是2所 ...

OpenMP 简单的规约

OpenMP 简单的规约的更多相关文章

随机推荐

热门专题