个人博客地址:http://www.bearoom.xyz/2019/02/22/openmp4/

一、private

private子句用于将一个或多个变量声明成线程私有的变量,这样每个线程都有该变量的副本,不同线程的操作不会改变其他线程中的同名变量副本,且并行块的所有操作都不会影响外面的同名共享变量。 例子:

int k = 11;
printf("k=%d, &k=%d\n", k, &k);
omp_set_num_threads(10);
#pragma omp parallel for private(k)
for (k = 0; k < 10; k++)
{
printf("k=%d, &k=%d, threadID=%d\n", k, &k, omp_get_thread_num());
}
printf("k=%d, &k=%d\n", k, &k);



这个说明并行块中每个线程的变量k跟共享变量k的地址都是不一样的。但是,这里加不加private(k)结果都是一样的。但是在下面这种情况,加不加private(k)结果是不一样的。 不加的情况:

int k = 11;
printf("k=%d, &k=%d\n", k, &k);
omp_set_num_threads(10);
#pragma omp parallel for
for (int i = 0; i < 10; i++)
{
k = i;
printf("k=%d, &k=%d, threadID=%d\n", k+=i, &k, omp_get_thread_num());
}
printf("k=%d, &k=%d\n", k, &k);



加private(k)的情况:



要注意,加private(k)的时候以下的情况是会编译报错的:

int k = 11;
printf("k=%d, &k=%d\n", k, &k);
omp_set_num_threads(10);
#pragma omp parallel for private(k)
for (int i = 0; i < 10; i++)
{
printf("k=%d, &k=%d, threadID=%d\n", k+=i, &k, omp_get_thread_num());
}
printf("k=%d, &k=%d\n", k, &k);

二、firstprivate

private就是并行块内部的同名变量与外部的共享变量无关,而firstprivate就是该变量依然无关,但是会用外部共享变量来初始化并行块内部的变量。例子:

int k = 11;
printf("k=%d, &k=%d\n", k, &k);
omp_set_num_threads(10);
#pragma omp parallel for firstprivate(k)
for (int i = 0; i < 10; i++)
{
printf("k=%d, &k=%d, threadID=%d\n", k += i, &k, omp_get_thread_num());
}
printf("k=%d, &k=%d\n", k, &k);



k是用了外部的值做初始化,但是不改变外部的值,不加的话,结果如下:



与firstprivate(k)相对的有lastprivate(k),如果只有firstprivate则不会改变外部,加了lastprivate就可以改变外部变量,此时并不是将运行在最后的一个线程的结果复制给外部共享变量,而是将语法上的最后一个线程的值复制给外部变量。

三、shared,default

shared子句用来声明一个或多个变量是共享变量,这个共享变量在不同线程之间是共享的,所以要注意当对共享变量存在写操作的时候就需要加以保护。
default允许用户控制并行区域中变量的共享属性,用法如下:default(shared | none),使用shared时,缺省情况下,传入并行区域内的同名变量被当作共享变量来处理,不会产生线程私有副本,除非使用private等子句来指定某些变量为私有的才会产生副本;如果使用none作为参数,那么线程中用到的变量必须显示指定是共享的还是私有的,除了那些有明确定义的除外。

四、reduction

reduction子句主要用来对一个或多个参数条目指定一个操作符,每个线程将创建参数条目的一个私有拷贝,在区域的结束处,将用私有拷贝的值通过指定的运行符运算,原始的参数条目被运算结果的值更新。也就说,传进来的参数在线程结束后,会依次对所有线程的拷贝做reduction指定的运算符操作,将结果复制给该参数。
reduction的用法:reduction(operator:list),operator的符号如下:



例子 :

int k = 2;
printf("k=%d, &k=%d\n", k, &k);
omp_set_num_threads(10);
#pragma omp parallel for reduction(*:k)
for (int i = 0; i < 10; i++)
{
printf("k=%d, &k=%d, threadID=%d\n", k = 2, &k, omp_get_thread_num());
}
printf("k=%d, &k=%d\n", k, &k);



注意,如果在并行区域内不加锁保护就直接对共享变量进行写操作,存在数据竞争问题,会导致不可预测的异常结果。共享数据作为private、firstprivate、lastprivate、threadprivate、reduction子句的参数进入并行区域后,就变成线程私有了,不需要加锁保护了。

五、copyin

这里要介绍copyin,要先讲下指令threadprivate,threadprivate的作用是指定一个变量是线程局部存储(thread local storage),也就是不同并行区域的同个线程里,这个变量是全局的,这个指令的作用效果如下:

int A = 100;
#pragma omp threadprivate(A) int main(int argc, char *argv[])
{
#pragma omp parallel for
for (int i = 0; i < 5; i++)
{
A++;
printf("Thread ID, i, A: %d, %d, %d\n", omp_get_thread_num(), i, A);
}
printf("Global A: %d\n", A); #pragma omp parallel for
for (int i = 0; i < 5; i++)
{
A++;
printf("Thread ID, i, A: %d, %d, %d\n", omp_get_thread_num(), i, A);
}
printf("Global A: %d\n", A);
system("pause");
return 0;
}



可以看到我使用了两个完全一样的并行块#pragma omp parallel for,每个块都是for循环五次,我的电脑CPU是4线程的,所以,四个线程执行一次并行的++,那么首先是都会变成101,然后有一次线程多执行了一次,变成两次++就是102,此时全局A就变成102。但是第二个for循环,可以看到,线程0的初始值是102,但是线程1、2、3的初始值不是,而是上一个并行块的线程中最后的值。

然后在第二个for循环里加上一个copyin(A):

int A = 100;
#pragma omp threadprivate(A)
int main(int argc, char *argv[])
{
#pragma omp parallel for
for (int i = 0; i < 5; i++)
{
A++;
printf("Thread ID, i, A: %d, %d, %d\n", omp_get_thread_num(), i, A);
}
printf("Global A: %d\n", A);
#pragma omp parallel for copyin(A)
for (int i = 0; i < 5; i++)
{
A++;
printf("Thread ID, i, A: %d, %d, %d\n", omp_get_thread_num(), i, A);
}
printf("Global A: %d\n", A);
system("pause");
return 0;
}



可以看到,此时第二个for循环的A的初始值是102。这是因为copyin将主线程threadprivate修饰的变量的值拷贝到执行并行区域的各个线程的threadprivate变量中作为变量初始值。copyin修饰的参数必须是被threadprivate修饰过的。

六、copyprivate

copyprivate子句提供了一种机制用一个私有变量将一个值从一个线程广播到执行同一并行区域的其他线程。copyprivate子句可以关联single构造,在single构造的barrier到达之前就完成了广播工作。copyprivate可以对private和threadprivate子句中的变量进行操作,但是当使用single构造时,copyprivate的变量不能用于private和firstprivate子句中。

single修饰的代码块将会在一个线程中执行,但是不一定会是主线程,例子:

static int A = 100;
#pragma omp threadprivate(A)
int B = 100;
int C = 1000;
#pragma omp parallel firstprivate(B) copyin(A)
{
#pragma omp single
{
A = 10;
B = 20;
printf("Thread ID = %d, A = %d,B = %d, C = %d\n", omp_get_thread_num(), A, B, C);
}
printf("Initial Thread ID = %d, A = %d,B = %d, C = %d\n", omp_get_thread_num(), A, B, C);
}
printf("Global A = %d, B = %d, C = %d\n", A, B, C);



single修饰的后面一段代码是在线程2中执行,并且就执行一次,因为其他线程是不执行的。然后在single后面用copyprivate修饰一个变量,如A,#pragma omp single copyprivate(A),则得到的结果是:



可以看到,A被广播到了其他线程了。

紫陌红尘拂面来,

无人不道看花回。

玄都观里桃千树,

尽是刘郎去后栽。

--刘禹锡 《元和十年自朗州至京戏赠看花诸君子/玄都观桃花》

OpenMP笔记(四)的更多相关文章

  1. C#可扩展编程之MEF学习笔记(四):见证奇迹的时刻

    前面三篇讲了MEF的基础和基本到导入导出方法,下面就是见证MEF真正魅力所在的时刻.如果没有看过前面的文章,请到我的博客首页查看. 前面我们都是在一个项目中写了一个类来测试的,但实际开发中,我们往往要 ...

  2. 《MFC游戏开发》笔记四 键盘响应和鼠标响应:让人物动起来

    本系列文章由七十一雾央编写,转载请注明出处. http://blog.csdn.net/u011371356/article/details/9327377 作者:七十一雾央 新浪微博:http:// ...

  3. IOS学习笔记(四)之UITextField和UITextView控件学习

    IOS学习笔记(四)之UITextField和UITextView控件学习(博客地址:http://blog.csdn.net/developer_jiangqq) Author:hmjiangqq ...

  4. java之jvm学习笔记四(安全管理器)

    java之jvm学习笔记四(安全管理器) 前面已经简述了java的安全模型的两个组成部分(类装载器,class文件校验器),接下来学习的是java安全模型的另外一个重要组成部分安全管理器. 安全管理器 ...

  5. Java学习笔记四---打包成双击可运行的jar文件

    写笔记四前的脑回路是这样的: 前面的学习笔记二,提到3个环境变量,其中java_home好理解,就是jdk安装路径:classpath指向类文件的搜索路径:path指向可执行程序的搜索路径.这里的类文 ...

  6. Java加密与解密笔记(四) 高级应用

    术语列表: CA:证书颁发认证机构(Certificate Authority) PEM:隐私增强邮件(Privacy Enhanced Mail),是OpenSSL使用的一种密钥文件. PKI:公钥 ...

  7. Learning ROS for Robotics Programming Second Edition学习笔记(四) indigo devices

    中文译著已经出版,详情请参考:http://blog.csdn.net/ZhangRelay/article/category/6506865 Learning ROS for Robotics Pr ...

  8. Typescript 学习笔记四:回忆ES5 中的类

    中文网:https://www.tslang.cn/ 官网:http://www.typescriptlang.org/ 目录: Typescript 学习笔记一:介绍.安装.编译 Typescrip ...

  9. Django开发笔记四

    Django开发笔记一 Django开发笔记二 Django开发笔记三 Django开发笔记四 Django开发笔记五 Django开发笔记六 1.邮箱激活 users app下,models.py: ...

随机推荐

  1. 用JS改变embed标签的src属性

    思路: A.先隐藏embed标签 B.清除embed元素 C.为embed重新赋值,加入Html页面中 1.html代码 <object id="forfun" classi ...

  2. nodejs - fs模块 - 文件操作

    1, fs.stat  检测是文件还是目录 2, fs.mkdir 创建目录 var fs = require('fs') fs.mkdir('./dir',function(err){ if(err ...

  3. 图片字节流生成bmp文件

    1 BITMAPFILEHEADER bfh;//文件头 2 bfh.bfType=0x4d42; bfh.bfOffBits=sizeof(bfh)+sizeof(BITMAPINFOHEADER) ...

  4. ORA-22813 ORA-06512

    ORA-22813:操作数值超出系统限制. 原因:   对象或集合值太大.SORT上下文中值的大小可能超过30k,或者可用内存的大小可能太大. 操作:  选择其他值并重试该操作. ORA-06512错 ...

  5. lz-cms

    去年这个时候也是8月份,离开了生活9年的福州来到厦门,已整整一年的时间.离开福州的原因,就是不想让自己在安逸中沉沦下去,需要重新寻找技术的激情.来到新公司后,也开始投入老板梦想中的那个伟大CMS的研发 ...

  6. spring源码 BeanFactory根接口

    /* * Copyright 2002-2016 the original author or authors. * * Licensed under the Apache License, Vers ...

  7. IO_课堂测试

    IO_课堂测试 一,用户需求 英语的26 个字母的频率在一本小说中是如何分布的?某类型文章中常出现的单词是什么?某作家最常用的词汇是什么?<飘> 中最常用的短语是什么,等等. (1)要求1 ...

  8. UVA - 1606 Amphiphilic Carbon Molecules(两亲性分子)(扫描法)

    题意:平面上有n(n <= 1000)个点,每个点为白点或者黑点.现在需放置一条隔板,使得隔板一侧的白点数加上另一侧的黑点数总数最大.隔板上的点可以看做是在任意一侧. 分析:枚举每个基准点i,将 ...

  9. POJ 2481:Cows 树状数组

    Cows Time Limit: 3000MS   Memory Limit: 65536K Total Submissions: 14906   Accepted: 4941 Description ...

  10. POJ 3071:Football

    Football Time Limit: 1000MS   Memory Limit: 65536K Total Submissions: 3600   Accepted: 1844 Descript ...