OpenMP笔记(四)
个人博客地址:http://www.bearoom.xyz/2019/02/22/openmp4/
一、private
private子句用于将一个或多个变量声明成线程私有的变量,这样每个线程都有该变量的副本,不同线程的操作不会改变其他线程中的同名变量副本,且并行块的所有操作都不会影响外面的同名共享变量。 例子:
int k = 11;
printf("k=%d, &k=%d\n", k, &k);
omp_set_num_threads(10);
#pragma omp parallel for private(k)
for (k = 0; k < 10; k++)
{
printf("k=%d, &k=%d, threadID=%d\n", k, &k, omp_get_thread_num());
}
printf("k=%d, &k=%d\n", k, &k);

这个说明并行块中每个线程的变量k跟共享变量k的地址都是不一样的。但是,这里加不加private(k)结果都是一样的。但是在下面这种情况,加不加private(k)结果是不一样的。 不加的情况:
int k = 11;
printf("k=%d, &k=%d\n", k, &k);
omp_set_num_threads(10);
#pragma omp parallel for
for (int i = 0; i < 10; i++)
{
k = i;
printf("k=%d, &k=%d, threadID=%d\n", k+=i, &k, omp_get_thread_num());
}
printf("k=%d, &k=%d\n", k, &k);

加private(k)的情况:

要注意,加private(k)的时候以下的情况是会编译报错的:
int k = 11;
printf("k=%d, &k=%d\n", k, &k);
omp_set_num_threads(10);
#pragma omp parallel for private(k)
for (int i = 0; i < 10; i++)
{
printf("k=%d, &k=%d, threadID=%d\n", k+=i, &k, omp_get_thread_num());
}
printf("k=%d, &k=%d\n", k, &k);
二、firstprivate
private就是并行块内部的同名变量与外部的共享变量无关,而firstprivate就是该变量依然无关,但是会用外部共享变量来初始化并行块内部的变量。例子:
int k = 11;
printf("k=%d, &k=%d\n", k, &k);
omp_set_num_threads(10);
#pragma omp parallel for firstprivate(k)
for (int i = 0; i < 10; i++)
{
printf("k=%d, &k=%d, threadID=%d\n", k += i, &k, omp_get_thread_num());
}
printf("k=%d, &k=%d\n", k, &k);

k是用了外部的值做初始化,但是不改变外部的值,不加的话,结果如下:

与firstprivate(k)相对的有lastprivate(k),如果只有firstprivate则不会改变外部,加了lastprivate就可以改变外部变量,此时并不是将运行在最后的一个线程的结果复制给外部共享变量,而是将语法上的最后一个线程的值复制给外部变量。
三、shared,default
shared子句用来声明一个或多个变量是共享变量,这个共享变量在不同线程之间是共享的,所以要注意当对共享变量存在写操作的时候就需要加以保护。
default允许用户控制并行区域中变量的共享属性,用法如下:default(shared | none),使用shared时,缺省情况下,传入并行区域内的同名变量被当作共享变量来处理,不会产生线程私有副本,除非使用private等子句来指定某些变量为私有的才会产生副本;如果使用none作为参数,那么线程中用到的变量必须显示指定是共享的还是私有的,除了那些有明确定义的除外。
四、reduction
reduction子句主要用来对一个或多个参数条目指定一个操作符,每个线程将创建参数条目的一个私有拷贝,在区域的结束处,将用私有拷贝的值通过指定的运行符运算,原始的参数条目被运算结果的值更新。也就说,传进来的参数在线程结束后,会依次对所有线程的拷贝做reduction指定的运算符操作,将结果复制给该参数。
reduction的用法:reduction(operator:list),operator的符号如下:

例子 :
int k = 2;
printf("k=%d, &k=%d\n", k, &k);
omp_set_num_threads(10);
#pragma omp parallel for reduction(*:k)
for (int i = 0; i < 10; i++)
{
printf("k=%d, &k=%d, threadID=%d\n", k = 2, &k, omp_get_thread_num());
}
printf("k=%d, &k=%d\n", k, &k);

注意,如果在并行区域内不加锁保护就直接对共享变量进行写操作,存在数据竞争问题,会导致不可预测的异常结果。共享数据作为private、firstprivate、lastprivate、threadprivate、reduction子句的参数进入并行区域后,就变成线程私有了,不需要加锁保护了。
五、copyin
这里要介绍copyin,要先讲下指令threadprivate,threadprivate的作用是指定一个变量是线程局部存储(thread local storage),也就是不同并行区域的同个线程里,这个变量是全局的,这个指令的作用效果如下:
int A = 100;
#pragma omp threadprivate(A)
int main(int argc, char *argv[])
{
#pragma omp parallel for
for (int i = 0; i < 5; i++)
{
A++;
printf("Thread ID, i, A: %d, %d, %d\n", omp_get_thread_num(), i, A);
}
printf("Global A: %d\n", A);
#pragma omp parallel for
for (int i = 0; i < 5; i++)
{
A++;
printf("Thread ID, i, A: %d, %d, %d\n", omp_get_thread_num(), i, A);
}
printf("Global A: %d\n", A);
system("pause");
return 0;
}

可以看到我使用了两个完全一样的并行块#pragma omp parallel for,每个块都是for循环五次,我的电脑CPU是4线程的,所以,四个线程执行一次并行的++,那么首先是都会变成101,然后有一次线程多执行了一次,变成两次++就是102,此时全局A就变成102。但是第二个for循环,可以看到,线程0的初始值是102,但是线程1、2、3的初始值不是,而是上一个并行块的线程中最后的值。
然后在第二个for循环里加上一个copyin(A):
int A = 100;
#pragma omp threadprivate(A)
int main(int argc, char *argv[])
{
#pragma omp parallel for
for (int i = 0; i < 5; i++)
{
A++;
printf("Thread ID, i, A: %d, %d, %d\n", omp_get_thread_num(), i, A);
}
printf("Global A: %d\n", A);
#pragma omp parallel for copyin(A)
for (int i = 0; i < 5; i++)
{
A++;
printf("Thread ID, i, A: %d, %d, %d\n", omp_get_thread_num(), i, A);
}
printf("Global A: %d\n", A);
system("pause");
return 0;
}

可以看到,此时第二个for循环的A的初始值是102。这是因为copyin将主线程threadprivate修饰的变量的值拷贝到执行并行区域的各个线程的threadprivate变量中作为变量初始值。copyin修饰的参数必须是被threadprivate修饰过的。
六、copyprivate
copyprivate子句提供了一种机制用一个私有变量将一个值从一个线程广播到执行同一并行区域的其他线程。copyprivate子句可以关联single构造,在single构造的barrier到达之前就完成了广播工作。copyprivate可以对private和threadprivate子句中的变量进行操作,但是当使用single构造时,copyprivate的变量不能用于private和firstprivate子句中。
single修饰的代码块将会在一个线程中执行,但是不一定会是主线程,例子:
static int A = 100;
#pragma omp threadprivate(A)
int B = 100;
int C = 1000;
#pragma omp parallel firstprivate(B) copyin(A)
{
#pragma omp single
{
A = 10;
B = 20;
printf("Thread ID = %d, A = %d,B = %d, C = %d\n", omp_get_thread_num(), A, B, C);
}
printf("Initial Thread ID = %d, A = %d,B = %d, C = %d\n", omp_get_thread_num(), A, B, C);
}
printf("Global A = %d, B = %d, C = %d\n", A, B, C);

single修饰的后面一段代码是在线程2中执行,并且就执行一次,因为其他线程是不执行的。然后在single后面用copyprivate修饰一个变量,如A,#pragma omp single copyprivate(A),则得到的结果是:

可以看到,A被广播到了其他线程了。
紫陌红尘拂面来,
无人不道看花回。
玄都观里桃千树,
尽是刘郎去后栽。
--刘禹锡 《元和十年自朗州至京戏赠看花诸君子/玄都观桃花》
OpenMP笔记(四)的更多相关文章
- C#可扩展编程之MEF学习笔记(四):见证奇迹的时刻
前面三篇讲了MEF的基础和基本到导入导出方法,下面就是见证MEF真正魅力所在的时刻.如果没有看过前面的文章,请到我的博客首页查看. 前面我们都是在一个项目中写了一个类来测试的,但实际开发中,我们往往要 ...
- 《MFC游戏开发》笔记四 键盘响应和鼠标响应:让人物动起来
本系列文章由七十一雾央编写,转载请注明出处. http://blog.csdn.net/u011371356/article/details/9327377 作者:七十一雾央 新浪微博:http:// ...
- IOS学习笔记(四)之UITextField和UITextView控件学习
IOS学习笔记(四)之UITextField和UITextView控件学习(博客地址:http://blog.csdn.net/developer_jiangqq) Author:hmjiangqq ...
- java之jvm学习笔记四(安全管理器)
java之jvm学习笔记四(安全管理器) 前面已经简述了java的安全模型的两个组成部分(类装载器,class文件校验器),接下来学习的是java安全模型的另外一个重要组成部分安全管理器. 安全管理器 ...
- Java学习笔记四---打包成双击可运行的jar文件
写笔记四前的脑回路是这样的: 前面的学习笔记二,提到3个环境变量,其中java_home好理解,就是jdk安装路径:classpath指向类文件的搜索路径:path指向可执行程序的搜索路径.这里的类文 ...
- Java加密与解密笔记(四) 高级应用
术语列表: CA:证书颁发认证机构(Certificate Authority) PEM:隐私增强邮件(Privacy Enhanced Mail),是OpenSSL使用的一种密钥文件. PKI:公钥 ...
- Learning ROS for Robotics Programming Second Edition学习笔记(四) indigo devices
中文译著已经出版,详情请参考:http://blog.csdn.net/ZhangRelay/article/category/6506865 Learning ROS for Robotics Pr ...
- Typescript 学习笔记四:回忆ES5 中的类
中文网:https://www.tslang.cn/ 官网:http://www.typescriptlang.org/ 目录: Typescript 学习笔记一:介绍.安装.编译 Typescrip ...
- Django开发笔记四
Django开发笔记一 Django开发笔记二 Django开发笔记三 Django开发笔记四 Django开发笔记五 Django开发笔记六 1.邮箱激活 users app下,models.py: ...
随机推荐
- Day4-T1
原题目 Hades 与 Dionysus 在狂饮后玩起了多米诺骨牌的小游戏. 现在桌上有 N 块多米诺骨牌,每块多米诺骨牌上半部分和下半部分上都有一个整数.每次翻转可让 一块多米诺骨牌上下翻转,即上下 ...
- 032-PHP中关于数组排序的usort()函数
<?php function re($a, $b) { return ($a < $b) ? 1 : -1; } $x = array(1, 3, 2, 5, 9); usort($x, ...
- DataTable数据类型的一些操作 增加行、插入行、修改数据、修改列名、修改列顺序、计算、选取或删除行(列)、排序、某列distinct值 等
Datatable 这个数据类型在C#中涉及到对数据库读取时的用处还是挺大的,最近在处理一个报表开发时,一开始把所有的操作都放在sql 上面来做,就是我需要什么样的数据我就query出什么,但是这样其 ...
- ZOJ 1409 communication system 双变量型的DP
这个题目一开始不知道如何下手,感觉很像背包,里面有两个变量,一个带宽B,一个价格P,有n个设备,每个设备有k个可选的器材(只需选一个),每个器材都有自己的B和P, n个设备选n个器材,最终,FB=所有 ...
- 基于Ambari的WebUI部署Hive服务
基于Ambari的WebUI部署Hive服务 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.部署Ambari服务 博主推荐阅读: https://www.cnblogs.com ...
- 了解java常用框架
今天我看了一点看起来比较片面的东西,java常用基本床架,并且在网上搜了相关的知识和概括总结,用来继续后期的学习: 1.struts2框架,这是最经典的框架(可以说没有“之一”).可以帮你快速搭建出一 ...
- BZOJ:2190: [SDOI2008]仪仗队
题解:欧拉函数 #include<iostream> #include<cstdio> #include<cstring> using namespace std; ...
- Python学习——购物车程序
问题需求: 1.启动程序,让用户输入工资,然后打印商品列表 2.允许用户根据商品编号购买商品 3.用户选择商品后,检测余额是否够,够就直接扣款,不够就提醒 4.可随时退出,退出时,打印已购买的商品和余 ...
- Dubbo与Zookeeper 简介
转自http://blog.csdn.net/congcong68/article/details/41113239 首先说一下Dubbo解决什么问题: (1)当服务越来越多时,服务Url配置管理变得 ...
- “设计型web前端与开发型web前端”有哪些区别?
学web前端,你弄懂开发型web前端和设计型web前端的区别了吗?今天给大家梳理一下设计型web前端做什么?都要学习什么? 想必大家也会遇到这种情况,要做一个项目,产品经理说产品原型图已经画好了,让我 ...