基于GCC的openMP学习与测试

（一）、openMP简述

Open Multiprocessing (OpenMP) 框架是一种功能极为强大的规范，可以帮助您利用 C、C++ 和 Fortran 应用程序中的多个核心带来的好处，是基于共享内存模式的一种并行编程模型, 使用十分方便, 只需要串行程序中加入OpenMP预处理指令, 就可以实现串行程序的并行化。

（二）、openMP简单使用

1、简单的HelloWord程序

#include <iostream>

int main()

{

  #pragma omp parallel

  {

    std::cout << "Hello World!\n";

  }

}

#pragma omp parallel 仅在您指定了 -fopenmp 编译器选项后才会发挥作用。在编译期间，GCC 会根据硬件和操作系统配置在运行时生成代码，创建尽可能多的线程。
只运行 g++ hello.cpp，只会打印出一行Hello world!
运行g++ hello.cpp -fopenmp,打印出12个Hello World!（12个是因为我用的是linux服务器默认分配的）
运行结果

user@NLP ~/vsworksapce $ g++ hello.cpp

user@NLP ~/vsworksapce $ ./a.out

Hello World!

user@NLP ~/vsworksapce $ g++ hello.cpp -fopenmp

user@NLP ~/vsworksapce $ ./a.out

Hello World!

Hello World!

Hello World!

Hello World!

Hello World!

Hello World!

Hello World!

Hello World!

Hello World!

Hello World!

Hello World!

Hello World!

2、如何自定义线程数量

num_threads的设置
omp_set_num_threads()库函数的设置

#include <omp.h>

#include <iostream>

int main()

{

  int number_threads = ;

  omp_set_num_threads(number_threads) //方法二

  #pragma omp parallel num_threads(number_threads) //方式一

  {

    std::cout << "Hello World!\n";

  }

}

OMP_NUM_THREADS环境变量的设置（Linux下：export OMP_NUM_THREADS=4）
编译器默认实现（一般而言，不指定具体线程数量的情况下，默认实现的总线程数等于处理器的核心数）

3、parallel sections 编译指示

pragma omp sections和pragma omp parallel之间的代码将由所有线程并行运行。pragma omp sections之后的代码块通过pragma omp section进一步被分为各个子区段。每个pragma omp section块将由一个单独的线程执行。但是，区段块中的各个指令始终按顺序运行。

#include <iostream>

int main()

{

   #pragma omp parallel

  {

    std::cout << "parallel \n";

    #pragma omp sections

    {

      #pragma omp section

      {

        std::cout << "section1 \n";

      }

      #pragma omp section

      {

        std::cout << "sectio2 \n";

        std::cout << "after sectio2 \n";

      }

      #pragma omp section

      {

        std::cout << "sectio3 \n";

        std::cout << "after sectio3 \n";

      }

    }

  }

}

//运行结果

user@NLP ~/vsworksapce $ g++ openMP12.cpp -fopenmp

user@NLP ~/vsworksapce $ ./a.out

parallel

section1

sectio2

after sectio2

sectio3

after sectio3

parallel

parallel

parallel

parallel

parallel

parallel

parallel

parallel

parallel

parallel

parallel

4、还有一些omp_get_wtime、for、while循环中的并行处理、OpenMP critical section、OpenMP实现锁和互斥、以及firstprivate和lastprivate指令等一些 openMP的使用可以参考（https://www.ibm.com/developerworks/cn/aix/library/au-aix-openmp-framework/）

（三）、openMP简单测试

1、简单的测试--不限制线程数量

#include <omp.h>

#include <time.h>

#include <iostream>

#include <ctime>

int main()

{

    time_t start,end1;

    time( &start );

    int a = ;

    #pragma omp parallel for

    for (int i = ; i < ; ++i)

    {

        for (int j = ; j < ; j++);

        //std::cout<< a++ << std::endl;

    }

    time( &end1 );

    double omp_end = omp_get_wtime( );

    std::cout<<std::endl;

    std::cout<<"Time_used " <<((end1 - start))<<"s"<<std::endl;

    std::cout<<"omp_time: "<<((omp_end - omp_start))<<std::endl;

    return ;

}

从下面的图表可以看出使用openMP的运行时间明显少于不使用openMP。

2、简单的测试--限制线程数量

#include <omp.h>

#include <time.h>

#include <iostream>

#include <ctime>

int main()

{

    time_t start,end1;

    time( &start );

    int a = ;

    double omp_start = omp_get_wtime( );

    #pragma omp parallel for num_threads(8)

    for (int i = ; i < ; ++i)

    {

        for (int j = ; j < ; j++);

    }

    time( &end1 );

    double omp_end = omp_get_wtime( );

    std::cout<<std::endl;

    std::cout<<"Time_used " <<((end1 - start))<<"s"<<std::endl;

    std::cout<<"omp_time: "<<((omp_end - omp_start))<<std::endl;

    return ;

}

从下面的图表能够看出，线程数量对程序运行时间也是有一定的影响的，影响的大小和程序运算数据量有关。

3、简单测试--提升数据量，限制线程数量

#include <omp.h>

#include <time.h>

#include <iostream>

#include <ctime>

int main()

{

    time_t start,end1;

    time( &start );

    int a = ;

    double omp_start = omp_get_wtime( );

    #pragma omp parallel for num_threads(12)

    for (int i = ; i < ; ++i)

    {

        for (int j = ; j < ; j++);

    }

    time( &end1 );

    double omp_end = omp_get_wtime( );

    std::cout<<std::endl;

    std::cout<<"Time_used " <<((end1 - start))<<"s"<<std::endl;

    std::cout<<"omp_time: "<<((omp_end - omp_start))<<std::endl;

    return ;

}

线程数量对程序的运行时间是有影响的，如果继续提升数据运算量，openMP的实验效果会更加明显。

4、简单测试--降低数据量，限制线程数量

#include <omp.h>

#include <time.h>

#include <iostream>

#include <ctime>

int main()

{

    time_t start,end1;

    time( &start );

    int a = ;

    double omp_start = omp_get_wtime( );

    #pragma omp parallel for

    for (int i = ; i < ; ++i)

    {

        for (int j = ; j < ; j++);

    }

    time( &end1 );

    double omp_end = omp_get_wtime( );

    std::cout<<std::endl;

    std::cout<<"Time_used " <<((end1 - start))<<"s"<<std::endl;

    std::cout<<"omp_time: "<<((omp_end - omp_start))<<std::endl;

    return ;

}

当数据量很小的时候，使用或者不使用openMP对于程序的运行时间影响不大。

（四）、openMP学习参考

通过 GCC 学习 OpenMP 框架：https://www.ibm.com/developerworks/cn/aix/library/au-aix-openmp-framework/
Guide into OpenMP ： http://bisqwit.iki.fi/story/howto/openmp/

基于GCC的openMP学习与测试的更多相关文章

基于GCC的openMP学习与测试（2）
一.openMP简单测试 1.简单测试(1) #include<omp.h> #include<time.h> #include<iostream> using n ...
基于linux下的NIST数字测试包安装过程
基于linux下的NIST数字测试包安装过程 1. 首先解决windows文件不能粘贴到Ubuntu的问题选择利用VMware Tools进行解决打开虚拟机VMware Workstation,启 ...
从Theano到Lasagne：基于Python的深度学习的框架和库
从Theano到Lasagne:基于Python的深度学习的框架和库摘要:最近,深度神经网络以“Deep Dreams”形式在网站中如雨后春笋般出现,或是像谷歌研究原创论文中描述的那样:Incept ...
【转】基于 Android NDK 的学习之旅-----数据传输（引用数据类型）
原文网址:http://www.cnblogs.com/luxiaofeng54/archive/2011/08/20/2147086.html 基于 Android NDK 的学习之旅-----数据 ...
基于 Keras 用深度学习预测时间序列
目录基于 Keras 用深度学习预测时间序列问题描述多层感知机回归多层感知机回归结合"窗口法" 改进方向扩展阅读本文主要参考了 Jason Brownlee 的博文 T ...
基于OpenCL的深度学习工具：AMD MLP及其使用详解
基于OpenCL的深度学习工具:AMD MLP及其使用详解 http://www.csdn.net/article/2015-08-05/2825390 发表于2015-08-05 16:33| 59 ...
测试开发：从0到1学习如何测试API网关
本文来自我的一名学员分享日常工作中,难免会遇到临危受命的情况,虽然没有这么夸张,但是也可能会接到一个陌生的任务,也许只是对这个概念有所耳闻.也许这个时候会感到一丝的焦虑,生怕没法完成领导交给的测试任 ...
语义分割：基于openCV和深度学习（二）
语义分割:基于openCV和深度学习(二) Semantic segmentation in images with OpenCV 开始吧-打开segment.py归档并插入以下代码: Semanti ...
语义分割：基于openCV和深度学习（一）
语义分割:基于openCV和深度学习(一) Semantic segmentation with OpenCV and deep learning 介绍如何使用OpenCV.深度学习和ENet架构执行 ...

随机推荐

python 人工智能资源推荐
原创 2017-06-05 玄魂工作室玄魂工作室我翻了翻我自己曾经看过的书,还是放弃了推荐.原因很简单,我对这个领域并不是很熟悉,我来推荐资源有点误人子弟.so,简单推点其他人建议给我的内容,希望 ...
Windows用户模式下注入方式总结
注入技术在病毒木马.游戏.打补丁等编程中应用很广泛,学习该技术不仅能帮助理解Windows工作原理,还能对病毒木马技术手段有更加深刻的理解,下面我们了解下各种注入方式吧. 一.DLL注入在注入技术中 ...
修改了SpringBoot的主类名称后，gradle build报错的解决办法
Unable to find a single main class from the following candidates [*.*Application]
spring2——IOC之Bean的装配
spring容器对于bean的装配提供了两个接口容器分别是"ApplicationContext接口容器"和"BeanFactory接口容器",其中" ...
Mac里安装配置Jdk
#下载jdk7的mac版 #官网下载地址http://www.oracle.com/technetwork/java/javase/downloads/jdk7-downloads-1880260.h ...
Downloader Middleware
downloader middleware作用:改写请求,如加入代理,加入头部等:处理异常等. # downloadMiddleware举例, 加代理 # 这里的类如果已经重新设置名称,记得在sett ...
JAVA数据库编程、JAVA XML解析技术
JDBC概述 JDBC是JAVA中提供的数据库编程API curd :数据库增删改链接字符串:String url = "mysql :/localhost :3306/jdbc/&quo ...
SQL基础-----DDL
1 (My)SQL入门这里用了(My)SQL这样的标题,目的是介绍标准SQL的同时,也将MySQL在标准SQL上的扩展一同介绍给读者. 2:SQL分类 SQL语句主要可以划分为以下3个类别 .DDL ...
最新的Windows环境搭建zeroMQ并使用java代码运行zeromq详细教程
最近项目要用zeromq,linux上很好配置使用,但是windows上配置与使用没有找到合适的解决方案,看的很头疼,这里自己总结下供大家参考准备工作: 1.libzmq下载地址:https://g ...
C# 删除文件夹
三种方法 1.这种方法简单,能删除文件夹内的所有文件(文件及子目录) DirectoryInfo di = new DirectoryInfo(string Path); di.Del ...