OpenMP笔记(四)
个人博客地址:http://www.bearoom.xyz/2019/02/22/openmp4/
一、private
private子句用于将一个或多个变量声明成线程私有的变量,这样每个线程都有该变量的副本,不同线程的操作不会改变其他线程中的同名变量副本,且并行块的所有操作都不会影响外面的同名共享变量。 例子:
int k = 11;
printf("k=%d, &k=%d\n", k, &k);
omp_set_num_threads(10);
#pragma omp parallel for private(k)
for (k = 0; k < 10; k++)
{
printf("k=%d, &k=%d, threadID=%d\n", k, &k, omp_get_thread_num());
}
printf("k=%d, &k=%d\n", k, &k);

这个说明并行块中每个线程的变量k跟共享变量k的地址都是不一样的。但是,这里加不加private(k)结果都是一样的。但是在下面这种情况,加不加private(k)结果是不一样的。 不加的情况:
int k = 11;
printf("k=%d, &k=%d\n", k, &k);
omp_set_num_threads(10);
#pragma omp parallel for
for (int i = 0; i < 10; i++)
{
k = i;
printf("k=%d, &k=%d, threadID=%d\n", k+=i, &k, omp_get_thread_num());
}
printf("k=%d, &k=%d\n", k, &k);

加private(k)的情况:

要注意,加private(k)的时候以下的情况是会编译报错的:
int k = 11;
printf("k=%d, &k=%d\n", k, &k);
omp_set_num_threads(10);
#pragma omp parallel for private(k)
for (int i = 0; i < 10; i++)
{
printf("k=%d, &k=%d, threadID=%d\n", k+=i, &k, omp_get_thread_num());
}
printf("k=%d, &k=%d\n", k, &k);
二、firstprivate
private就是并行块内部的同名变量与外部的共享变量无关,而firstprivate就是该变量依然无关,但是会用外部共享变量来初始化并行块内部的变量。例子:
int k = 11;
printf("k=%d, &k=%d\n", k, &k);
omp_set_num_threads(10);
#pragma omp parallel for firstprivate(k)
for (int i = 0; i < 10; i++)
{
printf("k=%d, &k=%d, threadID=%d\n", k += i, &k, omp_get_thread_num());
}
printf("k=%d, &k=%d\n", k, &k);

k是用了外部的值做初始化,但是不改变外部的值,不加的话,结果如下:

与firstprivate(k)相对的有lastprivate(k),如果只有firstprivate则不会改变外部,加了lastprivate就可以改变外部变量,此时并不是将运行在最后的一个线程的结果复制给外部共享变量,而是将语法上的最后一个线程的值复制给外部变量。
三、shared,default
shared子句用来声明一个或多个变量是共享变量,这个共享变量在不同线程之间是共享的,所以要注意当对共享变量存在写操作的时候就需要加以保护。
default允许用户控制并行区域中变量的共享属性,用法如下:default(shared | none),使用shared时,缺省情况下,传入并行区域内的同名变量被当作共享变量来处理,不会产生线程私有副本,除非使用private等子句来指定某些变量为私有的才会产生副本;如果使用none作为参数,那么线程中用到的变量必须显示指定是共享的还是私有的,除了那些有明确定义的除外。
四、reduction
reduction子句主要用来对一个或多个参数条目指定一个操作符,每个线程将创建参数条目的一个私有拷贝,在区域的结束处,将用私有拷贝的值通过指定的运行符运算,原始的参数条目被运算结果的值更新。也就说,传进来的参数在线程结束后,会依次对所有线程的拷贝做reduction指定的运算符操作,将结果复制给该参数。
reduction的用法:reduction(operator:list),operator的符号如下:

例子 :
int k = 2;
printf("k=%d, &k=%d\n", k, &k);
omp_set_num_threads(10);
#pragma omp parallel for reduction(*:k)
for (int i = 0; i < 10; i++)
{
printf("k=%d, &k=%d, threadID=%d\n", k = 2, &k, omp_get_thread_num());
}
printf("k=%d, &k=%d\n", k, &k);

注意,如果在并行区域内不加锁保护就直接对共享变量进行写操作,存在数据竞争问题,会导致不可预测的异常结果。共享数据作为private、firstprivate、lastprivate、threadprivate、reduction子句的参数进入并行区域后,就变成线程私有了,不需要加锁保护了。
五、copyin
这里要介绍copyin,要先讲下指令threadprivate,threadprivate的作用是指定一个变量是线程局部存储(thread local storage),也就是不同并行区域的同个线程里,这个变量是全局的,这个指令的作用效果如下:
int A = 100;
#pragma omp threadprivate(A)
int main(int argc, char *argv[])
{
#pragma omp parallel for
for (int i = 0; i < 5; i++)
{
A++;
printf("Thread ID, i, A: %d, %d, %d\n", omp_get_thread_num(), i, A);
}
printf("Global A: %d\n", A);
#pragma omp parallel for
for (int i = 0; i < 5; i++)
{
A++;
printf("Thread ID, i, A: %d, %d, %d\n", omp_get_thread_num(), i, A);
}
printf("Global A: %d\n", A);
system("pause");
return 0;
}

可以看到我使用了两个完全一样的并行块#pragma omp parallel for,每个块都是for循环五次,我的电脑CPU是4线程的,所以,四个线程执行一次并行的++,那么首先是都会变成101,然后有一次线程多执行了一次,变成两次++就是102,此时全局A就变成102。但是第二个for循环,可以看到,线程0的初始值是102,但是线程1、2、3的初始值不是,而是上一个并行块的线程中最后的值。
然后在第二个for循环里加上一个copyin(A):
int A = 100;
#pragma omp threadprivate(A)
int main(int argc, char *argv[])
{
#pragma omp parallel for
for (int i = 0; i < 5; i++)
{
A++;
printf("Thread ID, i, A: %d, %d, %d\n", omp_get_thread_num(), i, A);
}
printf("Global A: %d\n", A);
#pragma omp parallel for copyin(A)
for (int i = 0; i < 5; i++)
{
A++;
printf("Thread ID, i, A: %d, %d, %d\n", omp_get_thread_num(), i, A);
}
printf("Global A: %d\n", A);
system("pause");
return 0;
}

可以看到,此时第二个for循环的A的初始值是102。这是因为copyin将主线程threadprivate修饰的变量的值拷贝到执行并行区域的各个线程的threadprivate变量中作为变量初始值。copyin修饰的参数必须是被threadprivate修饰过的。
六、copyprivate
copyprivate子句提供了一种机制用一个私有变量将一个值从一个线程广播到执行同一并行区域的其他线程。copyprivate子句可以关联single构造,在single构造的barrier到达之前就完成了广播工作。copyprivate可以对private和threadprivate子句中的变量进行操作,但是当使用single构造时,copyprivate的变量不能用于private和firstprivate子句中。
single修饰的代码块将会在一个线程中执行,但是不一定会是主线程,例子:
static int A = 100;
#pragma omp threadprivate(A)
int B = 100;
int C = 1000;
#pragma omp parallel firstprivate(B) copyin(A)
{
#pragma omp single
{
A = 10;
B = 20;
printf("Thread ID = %d, A = %d,B = %d, C = %d\n", omp_get_thread_num(), A, B, C);
}
printf("Initial Thread ID = %d, A = %d,B = %d, C = %d\n", omp_get_thread_num(), A, B, C);
}
printf("Global A = %d, B = %d, C = %d\n", A, B, C);

single修饰的后面一段代码是在线程2中执行,并且就执行一次,因为其他线程是不执行的。然后在single后面用copyprivate修饰一个变量,如A,#pragma omp single copyprivate(A),则得到的结果是:

可以看到,A被广播到了其他线程了。
紫陌红尘拂面来,
无人不道看花回。
玄都观里桃千树,
尽是刘郎去后栽。
--刘禹锡 《元和十年自朗州至京戏赠看花诸君子/玄都观桃花》
OpenMP笔记(四)的更多相关文章
- C#可扩展编程之MEF学习笔记(四):见证奇迹的时刻
前面三篇讲了MEF的基础和基本到导入导出方法,下面就是见证MEF真正魅力所在的时刻.如果没有看过前面的文章,请到我的博客首页查看. 前面我们都是在一个项目中写了一个类来测试的,但实际开发中,我们往往要 ...
- 《MFC游戏开发》笔记四 键盘响应和鼠标响应:让人物动起来
本系列文章由七十一雾央编写,转载请注明出处. http://blog.csdn.net/u011371356/article/details/9327377 作者:七十一雾央 新浪微博:http:// ...
- IOS学习笔记(四)之UITextField和UITextView控件学习
IOS学习笔记(四)之UITextField和UITextView控件学习(博客地址:http://blog.csdn.net/developer_jiangqq) Author:hmjiangqq ...
- java之jvm学习笔记四(安全管理器)
java之jvm学习笔记四(安全管理器) 前面已经简述了java的安全模型的两个组成部分(类装载器,class文件校验器),接下来学习的是java安全模型的另外一个重要组成部分安全管理器. 安全管理器 ...
- Java学习笔记四---打包成双击可运行的jar文件
写笔记四前的脑回路是这样的: 前面的学习笔记二,提到3个环境变量,其中java_home好理解,就是jdk安装路径:classpath指向类文件的搜索路径:path指向可执行程序的搜索路径.这里的类文 ...
- Java加密与解密笔记(四) 高级应用
术语列表: CA:证书颁发认证机构(Certificate Authority) PEM:隐私增强邮件(Privacy Enhanced Mail),是OpenSSL使用的一种密钥文件. PKI:公钥 ...
- Learning ROS for Robotics Programming Second Edition学习笔记(四) indigo devices
中文译著已经出版,详情请参考:http://blog.csdn.net/ZhangRelay/article/category/6506865 Learning ROS for Robotics Pr ...
- Typescript 学习笔记四:回忆ES5 中的类
中文网:https://www.tslang.cn/ 官网:http://www.typescriptlang.org/ 目录: Typescript 学习笔记一:介绍.安装.编译 Typescrip ...
- Django开发笔记四
Django开发笔记一 Django开发笔记二 Django开发笔记三 Django开发笔记四 Django开发笔记五 Django开发笔记六 1.邮箱激活 users app下,models.py: ...
随机推荐
- Redis 详解 (七) AOF 持久化
目录 1.AOF简介 2.AOF 配置 3.开启 AOF 4.AOF 文件恢复 5. AOF 重写 6.AOF的优缺点 上一篇文章我们介绍了Redis的RDB持久化,RDB 持久化存在一个缺点是一定时 ...
- mariadb galera启动问题
搭建了mariadb galera集群后,整个集群停掉后如何启动呢,我们要先启动那个节点呢,今天我尝试把集群机器全部停掉,然后任意启动一个节点,发现报如下的错误: 170620 21:32:55 [E ...
- Git详细命令
Git Guidegit的三种方式只在本地使用:将本地仓库上传到Github:下载GitHub上的仓库:1.只在本地使用在Git Bush上输入命令 mkdir git-demo-1 ——创建一个目录 ...
- 八十、SAP中数据库操作之 (FOR ALL ENTRIES IN )用法,比较难明白
一.代码如下 二.查询结果如下 三.我们把it_spfli的内表内容添加两个 四.结果如下,查询的是所有的JFK和SFO机场. *&------------------------------ ...
- Idea 打印GC
设置 Run ⇒ Edit Configurations ⇒ VM options 添加 -XX:+PrintGCDetails 运行程序后会在末尾打印GC信息 2019-11-02 13:07:47 ...
- scala 语言特性
Scala 语言特性 Unit 表示无值, 等价于java, C++中的void Null 表示空值或空引用 Nothing 所有其他类型的子类型, 表示没有值 Any 所有类型的超类, 任何实例都属 ...
- pop3&smtp
pop3&smtp pop3 Post Office Protocol - Version 3 pop3协议是离线邮件协议,是客户端取邮件用的. 默认监听在TCP:110端口. POP3会话有 ...
- Elasticsearch 搜索API
章节 Elasticsearch 基本概念 Elasticsearch 安装 Elasticsearch 使用集群 Elasticsearch 健康检查 Elasticsearch 列出索引 Elas ...
- SpringMVC: Ajax技术
SpringMVC:Ajax技术 简介 AJAX = Asynchronous JavaScript and XML(异步的 JavaScript 和 XML). AJAX 是一种在无需重新加载整个网 ...
- jmeter --- 压测时,如何让串联压测多个接口
1.新建测试计划,在测试计划里勾选“独立运行每个线程组” 2.分别在每个线程组,添加聚合报告,以得到每个线程组的压测结果 3.设置不同接口压测的vu等,并为每个线程组,设置合理的启动延迟时间