OpenMP编程总结表

本文对OpenMP 2.0的全部语法——Macro（宏定义）、Environment Variables（环境变量）、Data Types（数据类型）、Compiler Directives（编译指导语句）、Run-time Library Functions（库函数）的含义用表格进行总结，以便于快速使用OpenMP。如果想详细了解表格中项的含义，或者想要看一些实例，请参阅我的另一篇博文：OpenMP共享内存并行编程详解。

1. Macro

_OPENMP

2. Environment Variables

Environment Variables	Description
OMP_SCHEDULE	“#pragma omp [parallel] for schedule(runtime)”时 C++ for多次迭代划分到多个线程的方式，取值："static[,chunk_size]", "dynamic [,chunk_size]", "guided[,chunk_size]"
OMP_NUM_THREADS	默认线程数，取值：number
OMP_DYNAMIC	默认是否使能动态调整线程数，取值："TURE", "FALSE"
OMP_NESTED	默认是否使能并行嵌套（使能后需要实现支持），取值："TURE", "FALSE"

3. Data Types

Data Types	Description
omp_lock_t	记录lock的状态
omp_nest_lock_t	记录lock的状态，还有嵌套层数

4. Compiler Directives

Directive/syntax
Description	Clauses(optional)
#pragma omp parallel [clause[ [, ]clause] ...] new-line structured-block
定义一个parallel region，该parallel region将被多个线程并行执行	if(scalar-expression)：条件并行化 num_threads(integer-expression)：设置线程数 private, firstprivate, shared, default, reduction, copyin见表末
#pragma omp for [clause[[,] clause] ... ] new-line for-loop
将C++ for循环的多次迭代划分给多个线程（C++ for需符合一定限制），块末尾隐含一个barrier	ordered：配合ordered directive使用 schedule(kind[,chunk_size])：C++ for多次迭代的划分方式，参数：static[,chunk_size], dynamic[,chunk_size], guided[,chunk_size], runtime nowait：禁止隐含的barrier private, firstprivate, lastprivate, reduction见表末
#pragma omp sections [clause[[,] clause] ...] new-line { [#pragma omp section new-line] structured-block [#pragma omp section new-line structured-block ] ... }
定义包含多个section块的代码区，这些section块将被多个线程并行执行，section块用section定义，块末尾隐含一个barrier	nowait：禁止隐含的barrier private, firstprivate, lastprivate, reduction见表末
#pragma omp single [clause[[,] clause] ...] new-line structured-block
代码将仅被一个线程执行，具体是哪个线程不确定，块末尾隐含一个barrier	nowait：禁止隐含的barrier private, firstprivate, copyprivate见表末
#pragma omp parallel for [clause[[,] clause] ...] new-line for-loop
同只含一个for directive 的parallel region	Parallel和for的clauses，除nowait外
#pragma omp parallel sections [clause[[,] clause] ...] new-line { [#pragma omp section new-line] structured-block [#pragma omp section new-line structured-block ] ... }
同只含一个sections directive 的parallel region	Parallel和sections的clauses，除nowait外
#pragma omp master new-line structured-block
代码将仅被主线程执行，块末尾没有隐含的barrier
#pragma omp critical [(name)] new-line structured-block
定义一个临界区，保证同一时刻只有一个线程访问临界区
#pragma omp barrier new-line
定义一个同步，所有线程都执行到该行后，所有线程才继续执行后面的代码
#pragma omp atomic new-line expression-stmt
变量将被原子的更新，expression-stmt需是 a++, a--, ++a, --a, a?=expr 之一，其中 ? 可以为 +, *, -, /, &, ^, \|, <<, >>
#pragma omp flush [(variable-list)] new-line
所有线程对所有共享对象具有相同的内存视图（view of memory），例如，确保将变量的新值写回内存或从内存读取，而不是使用以前读到寄存器或缓存中的值
#pragma omp ordered new-line structured-block
使用在有ordered clause的for directive（或parallel for）中，代码将被按迭代次序执行（像串行程序一样）
#pragma omp threadprivate(variable-list) new-line
将全局或静态变量声明为线程私有的。
Data-Sharing Attribute Clauses
private(variable-list)：每个线程有一个变量的私有副本，调用默认构造函数初始化可用于的directives：parallel, for, sections, single firstprivate(variable-list)：private基础上，拷贝共享变量值初始化线程私有副本可用于的directives：parallel, for, sections, single lastprivate(variable-list)：private基础上，将执行最后一次迭代（for）或最后一个section块（sections）的线程的私有副本拷贝到共享变量可用于的directives：for, sections shared(variable-list)：声明变量为线程间共享，相对于private 可用于的directives：parallel default(shared\|none)：参数shared同于将所有变量用share clause定义，参数none指示对没有用private, shared, reduction, firstprivate, lastprivate clause定义的变量报错可用于的directives：parallel reduction(op:variable-list)：定义对变量进行归约操作可用于的directives：parallel, for, sections copyin(variable-list)：让threadprivate声明的变量的值和主线程的值相同可用于的directives：parallel copyprivate(variable-list)：不同线程中的私有变量的值在所有线程中共享可用于的directives：single

5. Run-time Library Functions

要使用这些函数，需要 #include<omp.h> 。

Function	Description
Execution Environment Functions
void omp_set_num_threads(int);	设置默认parallel region的线程数
int omp_get_num_threads();	返回该函数所在parallel region的线程数
int omp_get_max_threads();	返回值等于或大于该函数所在处的未使用num_threads clause的parallel region的线程数，通常这个最大数量由omp_set_num_threads()或OMP_NUM_THREADS环境变量决定
int omp_get_thread_num();	返回线程编号，主线程编号为0
int omp_get_num_procs();	返回可用处理器数（一般等于CPU物理核心数）
int omp_in_parallel();	如果在parallel region内，则返回非0（一般为1），否则返回0
void omp_set_dynamic(int);	设置是否使能运行时动态调整parallel region的线程数，非0使能，0不使能
int omp_get_dynamic();	当前使能运行时动态调整parallel region的线程数，返回非0（一般为1），否则返回0
void omp_set_nested(int);	设置是否使能并行嵌套，非0使能，0不使能（若使能需要实现支持）
int omp_get_nested();	当前使能并行嵌套，返回非0（一般为1），否则返回0
Lock Functions
void omp_init_lock(omp_lock_t*);		初始化一个简单Lock
void omp_destroy_lock(omp_lock_t*);		删除一个简单Lock
void omp_set_lock(omp_lock_t*);		等待直到Lock可用，然后锁上该Lock
void omp_unset_lock(omp_lock_t*);		释放该Lock使其可用
void omp_test_lock(omp_lock_t*);		测试当前Lock，若可用返回非0，否则返回0
void omp_init_nest_lock(omp_nest_lock_t*);		初始化一个可嵌套Lock
void omp_destroy_nest _lock(omp_nest_lock_t*);		删除一个可嵌套Lock
void omp_set_nest _lock(omp_nest_lock_t*);		等待直到可嵌套Lock可用，然后锁上该可嵌套Lock
void omp_unset_nest _lock(omp_nest_lock_t*);		释放该可嵌套Lock使其可用
void omp_test_nest _lock(omp_nest_lock_t*);		测试当前可嵌套Lock，若可用返回非0，否则返回0
Timing Routines
double omp_get_wtick();	返回CPU时钟周期，以秒为单位
double omp_get_wtime();	返回从起始计时点开始逝去的时间，以秒为单位

6. 参考文献

wikipedia关于OpenMP条目

OpenMP 2.0 Specification

MSDM上关于OpenMP条目

《MPI与OpenMP并行程序设计（C语言版）》第17章，Michael J. Quinn著，陈文光等译，清华大学出版社，2004

OpenMP编程总结表的更多相关文章

openMP编程(上篇)之指令和锁
openMP简介 openMP是一个编译器指令和库函数的集合,主要是为共享式存储计算机上的并行程序设计使用的. 当计算机升级到多核时,程序中创建的线程数量需要随CPU核数变化,如在CPU核数超过线程数 ...
openMP编程(上篇)之并行程序设计
openMP简介 openMP是一个编译器指令和库函数的集合,主要是为共享式存储计算机上的并行程序设计使用的. 当计算机升级到多核时,程序中创建的线程数量需要随CPU核数变化,如在CPU核数超过线程数 ...
一个openMP编程处理图像的示例
一个openMP编程处理图像的示例: 从硬盘读入两幅图像,对这两幅图像分别提取特征点,特征点匹配,最后将图像与匹配特征点画出来.理解该例子需要一些图像处理的基本知识,我不在此详细介绍.另外,编译该例需 ...
openMP编程(下篇)之数据私有与任务调度
title: openMP编程(下篇)之数据处理子句与任务调度 tags: ["openMP"] notebook: 分布式程序_Linux --- openMP并行编程中数据的共 ...
OpenMP编程的任务调度控制
在OpenMP的for任务分担中,各个线程的任务划分是可以由程序员控制调整的.考虑这样一种情况,当在一个循环中每次迭代的计算量不相等时,如果根据系统默认简单的给每个线程分配相同次数的迭代量的话,会导致 ...
Go-Web编程_表单_0x02_验证表单的输入
开发Web的一个原则就是,不能信任用户输入的任何信息,所以验证和过滤用户的输入信息就变得非常重要,我们经常会在微博.新闻中听到某某网站被入侵了,存在什么漏洞,这些大多是因为网站对于用户输入的信息没有做 ...
Python -- Windows编程 -- 注册表
1.查询开机自启项 startUp.py import re import win32api, win32con def GetValues(fullname): #分割出基本项name[0] nam ...
Openmp编程练习
火车卖票 // OpenMP2.cpp : 定义控制台应用程序的入口点. // #include "stdio.h" #include "omp.h" #inc ...
OpenMP共享内存并行编程详解
实验平台:win7, VS2010 1. 介绍平行计算机可以简单分为共享内存和分布式内存,共享内存就是多个核心共享一个内存,目前的PC就是这类(不管是只有一个多核CPU还是可以插多个CPU,它们都有 ...

随机推荐

LINUX RHCE 笔记
磁盘类: 新增一个SCSI磁盘,LINUX无法看到(不重启)echo "- - -" > /sys/class/scsi_host/host2/scan就看到了. part ...
bzoj 3530: [Sdoi2014]数数
#include<cstdio> #include<iostream> #include<cstring> #define M 1509 #define MO 10 ...
LeetCode 6 ZigZag Conversion 模拟难度:0
https://leetcode.com/problems/zigzag-conversion/ The string "PAYPALISHIRING" is written in ...
My Game --文件读取数据
My Game --线段数据中说到背景的绘制由贝赛尔曲线生成线段,用 DrawNode 画多边形,同时一张背景有两座山,一座山有两条以上贝赛尔曲线保存,用了嵌套的数据类:Bezier,LineLay ...
[SHTSC 2014] 信号增幅仪
最小覆盖圆算法.看着题解半蒙半抄的搞过去了… 主要参考以下http://blog.csdn.net/acdreamers/article/details/9406735http://blog.csdn ...
Debian 7环境安装TightVNC+Gnome远程桌面环境
昨天下午的时候一个Hostus网友希望在购买的VPS主机中安装桌面环境用来跑软件项目,其实也是我们很多用户习惯的VNC桌面,毕竟在LINUX服务器中也无法去安装WINDOWS系统,尤其是OPENVZ架 ...
关于LockSupport
concurrent包的基础 Doug Lea 的神作concurrent包是基于AQS (AbstractQueuedSynchronizer)框架,AQS框架借助于两个类:Unsafe(提供CAS ...
C++重载流运算符，将存储结构体的vector直接写入文件
我们知道,当vector很大的时候,如果使用循环的方式将其中的元素写入文件将非常费时,因此有没有办法将vector一次性写入文件呢? 采用流运算符重载的方法可以做到,不仅基本类型的vector可以一次 ...
如何使用.NET开发全版本支持的Outlook插件产品（四）——进阶探讨
插件项目所有代码都已经上传至 https://github.com/VanPan/TestOutlookAdding 如何定制Ribbon在不同界面的显示实际使用过程中出现的问题这个问题的来自十分 ...
Windows 8.1 with Update MSDN 简体/英文/繁体
PS:请不要使用离线下载,以免镜像损坏! 1.CN: 文件名:cn_windows_8.1_enterprise_with_update_x64_dvd_4048578.isoSHA1:2D9BFE9 ...

OpenMP编程总结表

OpenMP编程总结表的更多相关文章

随机推荐

热门专题