并行归并排序在程序开始时,会将n/comm_comm个键值分配给每个进程,程序结束时,所有的键值会按顺序存储在进程0中。为了做到这点,它使用了树形结构通信模式。当进程接收到另一个进程的键值时,它将该键值合并进自己排序的键值列表中。编写一个程序实现归并排序。进程0应该读入n的值,将其广播给其余进程。每个进程需要使用随机数生成器来创建n/comm_sz的局部int型数据列表。每个进程先排序各自的局部列表,然后进程0收集并打印这些局部列表。然后,这些进程使用树形结构通信合并全局列表给进程0,并打印最终结果。

  

如图,一般情况下,应由进程读入数据,然后一层一层的传到每个进程,每个进程排序完成之后,由上一层的进程进行合并。我这次做的只是输入数n,由每个进程产生n/comm_sz个随机数。

这里有一个问题,如何确定一个进程的父节点和子节点?

  你最初可能认为让在处理树中的每个节点是一个单独的进程中。这样,你可以简单地从二叉堆借用一个想法任何父节点的左子节点的下标2* K+1,右子节点的下标是2* K+2,一个节点的父节点是(K-1 )/ 2,这在一个完全二叉树中确定了父子关系。因此,一个内部节点将数据分成两半,并发送给每个子进程进行处理。这样叶节点,只是做了排序,内部节点等待然后从两个子节点接收回数据,执行两半的合并,以及(对于所有内部节点但非根节点本身)将结果发送到父节点。

  但是这样带来一个问题,就是当叶节点进行排序时,父节点在等待子节点,没有理由让父节点空闲等待子节点进行排序,我们希望让父节点充当左子节点进行工作,如图:
  这样每个节点将数据分成两半,每个节点自己处理数据的左半,右子节点处理数据的右半。这样之后你就要确定每个节点的父节点和子节点,你可以根据树形通信结构来确定每个节点的父节点和子节点。
  我们要先确定每个节点在树形通信结构的高度,叶节点的高度为0,这样根节点0的高度是3。节点0需要与节点4进行通信,对于如何计算出节点0的右子节点是4,可以通过将1转化成二进制并左移节点0所在的高度3减1位,即(myRank|(1<<2)),myRank表示节点的编号,这里是0,这样就可以计算出高度为3的节点0的右子节点。下一步节点0需要与节点2通信,节点4需要与节点6通信,此时节点0和4的高度为2,因此需要计算他们的子节点时通过公式((myRank|(1<<1)),这样计算出节点0的右子节点是2,节点4的右子节点时6,一般化的公式是(myRank|(myHeight-1))。
  计算完每个节点的子节点后,还要计算每个节点的父节点,每个节点的父节点可以通过如下公式进行计算,myRank&~(1<<myHeight)。
  下面是一个小的demo来展示通信过程,他展示了高度为3的通信树节点之间的通信过程,

 #include <stdio.h>

 void communicate ( int myHeight, int myRank )
{ int parent = myRank & ~(<<myHeight); if ( myHeight > )
{ int nxt = myHeight - ;
int rtChild = myRank | ( << nxt ); printf ("%d sending data to %d\n", myRank, rtChild);
communicate ( nxt, myRank );
communicate ( nxt, rtChild );
printf ("%d getting data from %d\n", myRank, rtChild);
}
if ( parent != myRank )
printf ("%d transmitting to %d\n", myRank, parent);
} int main ( void )
{ int myHeight = , myRank = ; printf ("Building a height %d tree\n", myHeight);
communicate(myHeight, myRank);
return ;
}

下面是输出结果

Building a height 3 tree
0 sending data to 4
0 sending data to 2
0 sending data to 1
1 transmitting to 0
0 getting data from 1
2 sending data to 3
3 transmitting to 2
2 getting data from 3
2 transmitting to 0
0 getting data from 2
4 sending data to 6
4 sending data to 5
5 transmitting to 4
4 getting data from 5
6 sending data to 7
7 transmitting to 6
6 getting data from 7
6 transmitting to 4
4 getting data from 6
4 transmitting to 0
0 getting data from 4

了解了通信结构之后,下面是mpi_merge_sort.c文件,利用MPI写的归并排序,

 #include<stdlib.h>
#include<stdio.h>
#include<time.h>
#include<math.h>
#include<string.h>
#include<mpi.h>
//读取输入的要排序的数的个数,并计算每个进程需要排序的个数
void read_n(int* n,int my_rank,MPI_Comm comm,int comm_sz,int* size);
//根据节点在通信树中的最高度为数组分配空间
void allocate_arrays(int** left,int** right,int** merge,int size,int height,int* myHeight,int my_rank);
//在left数组中生成size个随机数
void randnum(int* left,int size,int my_rank);
//以下三个函数时用于在通信树的叶节点对生成在left中的size个随机数进行快速排序
void swap(int *a,int *b);
int partition(int left[],int lo,int hi);
void QuickSort(int left[], int lo, int hi);
//父节点将接收子节点的数据与自己节点的数据进行归并
void merge_sort(int* left,int* right,int* merge,int size);
//控制通信,确定从哪个子节点中接收数据或向哪个父节点发送数据
void communicate ( int Height, int my_rank,int size,int* right,int* left,int* merge,MPI_Comm comm); int main(int argc,char* argv[]){
int n,comm_sz,my_rank;
int* left;
int* right;
int* merge;
int size;
int myHeight=;
MPI_Comm comm;
int height=; MPI_Init(NULL,NULL);
comm=MPI_COMM_WORLD;
MPI_Comm_size(comm,&comm_sz);
MPI_Comm_rank(comm,&my_rank);
read_n(&n,my_rank,comm,comm_sz,&size);
int tt=comm_sz;
for(int i=;i<comm_sz;i++){
tt=tt/;
if(tt==)
break;
height++;
}
allocate_arrays(&left,&right,&merge,size,height,&myHeight,my_rank);
randnum(left,size,my_rank);
QuickSort(left,,size-); communicate(height,my_rank,size,right,left,merge,comm);
if(my_rank==){
if(height%!=)
for(int i=;i<n;i++)
printf("%d ",merge[i]);
else
for(int i=;i<n;i++)
printf("%d ",left[i]);
printf("\n");
}
MPI_Finalize();
free(left);
free(right);
free(merge); }
void read_n(int* n,int my_rank,MPI_Comm comm,int comm_sz,int* size){
if(my_rank==){
printf("please intput the number of number\n");
scanf("%d",n);
}
MPI_Bcast (n,,MPI_INT,,comm);
*size=*n/comm_sz;
}
void allocate_arrays(int** left,int** right,int** merge,int size,int height,int* myHeight,int my_rank){
for(int i=;i<height;i++){
int parent=my_rank&~(<<i);
if(parent!=my_rank)
break;
(*myHeight)++;
}
*left=malloc((<<(*myHeight))*size*sizeof(int)); *right=malloc((<<(*myHeight-))*size*sizeof(int));
*merge=malloc((<<(*myHeight))*size*sizeof(int)); }
void randnum(int* left,int size,int my_rank){
srand(my_rank);
for(int i=;i<size;i++)
left[i]=rand();
}
void swap(int *a,int *b)
{
int temp=*a;
*a=*b;
*b=temp;
}
int partition(int* left,int lo,int hi)
{
int key=left[hi];
int i=lo-;
for(int j=lo;j<hi;j++)
{
if(left[j]<=key)
{
i=i+;
swap(&left[i],&left[j]);
}
}
swap(&left[i+],&left[hi]);
return i+;
}
void QuickSort(int *left, int lo, int hi)
{
if (lo<hi)
{
int k = partition(left, lo, hi);
QuickSort(left, lo, k-);
QuickSort(left, k+, hi);
}
}
void merge_sort(int* left,int* right,int* merge,int size){ int lp=,rp=,mp=;
for(int i=;i<*size;i++){
if(left[lp]<=right[rp]){
merge[mp]=left[lp];
lp++;
mp++;
}else{
merge[mp]=right[rp];
rp++;
mp++;
}
if(lp==size||rp==size)
break;
}
if(lp==size){
memcpy(&merge[mp],&right[rp],(size-rp)*sizeof(int));
}else{
memcpy(&merge[mp],&left[lp],(size-lp)*sizeof(int));
}
}
void communicate ( int Height, int my_rank,int size,int* right,int* left,int* merge,MPI_Comm comm)
{
for(int i=;i<=Height;i++){
int parent=my_rank&~(<<i);
if(parent==my_rank){
int rtChild=my_rank|(<<i); MPI_Recv(right,size,MPI_INT,rtChild,,comm,MPI_STATUS_IGNORE); merge_sort(left,right,merge,size); int* temp;
temp=left;
left=merge;
merge=temp;
size*=; }else{
MPI_Send(left,size,MPI_INT,parent,,comm);
break; }
} }

使用 mpicc -g -Wall -std=c99 -o mpi_merge_sort mpi_merge_sort.c 进行编译

使用 mpirun -n ./mpi_merge_sort

注意输入的进程个数一定是2的整数次幂,且输入的要排序数的个数要能整除进程个数

下面是一次的运行结果:

please intput the number of number
12
190686788    483147985    844158168    846930886    846930886    1205554746    1505335290    1681692777    1681692777    1738766719    1804289383    1804289383

参考资料:http://penguin.ewu.edu/~trolfe/ParallelMerge/ParallelMerge.html

并行归并排序——MPI的更多相关文章

  1. 疯狂的Java算法——插入排序,归并排序以及并行归并排序

    从古至今的难题 在IT届有一道百算不厌其烦的题,俗称排序.不管是你参加BAT等高端笔试,亦或是藏匿于街头小巷的草根笔试,都会经常见到这样一道百年难得一解的问题. 今天LZ有幸与各位分享一下算法届的草根 ...

  2. 典型分布式系统分析:Bigtable

    本文是典型分布式系统分析的第三篇,分析的是Bigtable,一个结构化的分布式存储系统. Bigtable作为一个分布式存储系统,和其他分布式系统一样,需要保证可扩展.高可用与高性能.与此同时,Big ...

  3. [Distributed ML] Yi WANG's talk

    王益,分布式机器学习的践行者,他的足迹值得后来者学习. 膜拜策略: LinkedIn高级分析师王益:大数据时代的理想主义和现实主义(图灵访谈)[心路历程] 分布式机器学习的故事-王益[历史由来] 分布 ...

  4. C++程序中调用MPI并行的批处理命令

    问题来源:在使用MPI时,将程序并行实现了,运行时需要在dos窗口下输入批处理命令,以完成程序的执行. 如:mpiexec -localroot -n 6 d:/mpi/pro.exe 但每次这样挺麻 ...

  5. 【MPI学习7】MPI并行程序设计模式:MPI的进程组和通信域

    基于都志辉老师MPI编程书中的第15章内容. 通信域是MPI的重要概念:MPI的通信在通信域的控制和维护下进行 → 所有MPI通信任务都直接或间接用到通信域这一参数 → 对通信域的重组和划分可以方便实 ...

  6. 【MPI学习6】MPI并行程序设计模式:具有不连续数据发送的MPI程序设计

    基于都志辉老师<MPI并行程序设计模式>第14章内容. 前面接触到的MPI发送的数据类型都是连续型的数据.非连续类型的数据,MPI也可以发送,但是需要预先处理,大概有两类方法: (1)用户 ...

  7. 【MPI学习4】MPI并行程序设计模式:非阻塞通信MPI程序设计

    这一章讲了MPI非阻塞通信的原理和一些函数接口,最后再用非阻塞通信方式实现Jacobi迭代,记录学习中的一些知识. (1)阻塞通信与非阻塞通信 阻塞通信调用时,整个程序只能执行通信相关的内容,而无法执 ...

  8. 【MPI学习2】MPI并行程序设计模式:对等模式 & 主从模式

    这里的内容主要是都志辉老师<高性能计算之并行编程技术——MPI并行程序设计> 书上有一些代码是FORTAN的,我在学习的过程中,将其都转换成C的代码,便于统一记录. 这章内容分为两个部分: ...

  9. 《并行程序设计导论》——MPI(Microsoft MPI)(1):Hello

    =================================版权声明================================= 版权声明:原创文章 禁止转载  请通过右侧公告中的“联系邮 ...

随机推荐

  1. 摘录 | WAREZ无形帝国

    开始 这会儿夜深了,他们昏昏睡去.随便哪栋建筑的某一个黑洞洞的窗口,你冷眼望去,没准就能看到一台白色的电脑,静静地卧在主人的书桌上.如果那主人睡得足够深,你就打开他的抽屉,你看到了什么?哦,我不是指他 ...

  2. 【NOIP模拟赛】【数学真奇妙】【递推】旅行者问题

    旅行者问题 [问题描述] lahub是一个旅行者的粉丝,他想成为一个真正的旅行者,所以他计划开始一段旅行.lahub想去参观n个目的地(都在一条直道上).lahub在起点开始他的旅行.第i个目的地和起 ...

  3. 代理模式(Proxy)--静态代理

    1,代理模式的概念 代理模式:为其他对象提供一种代理,以控制对这个对象的访问(代理对对象起到中介的作用,可去掉功能服务或者添加额外的服务) 2,代理模式的分类 (1)远程代理:类似于客户机服务器模式 ...

  4. PHP添加mcrypt扩展模块

    PHP添加mcrypt扩展模块 系统环境:CentOS6.3 APACHE:httpd-2.4.2 PHP:php-5.3.21 一.安装mcrypt 1.下载Libmcrypt,mhash,mcry ...

  5. jtds链接SqlServer数据库(整合)

    先前使用的时候没做汇总,现在结合遇到的问题总结下. 开始使用jdbc驱动配置调用SqlServer不合适,根据网上的资料修改成了jtds配置方式. 当时使用的maven配置,配置如下: <spa ...

  6. linux的file指令

    显示文件的类型,用命令 file 可以使你知道某个文件究竟是ELF格式的可执行文件, 还是shell script文 件或是其他的什么格式 例如:#file startx 语 法:file [-beL ...

  7. Javascript中的原型链、prototype、__proto__的关系

    javascript  2016-10-06  1120  9 上图是本宝宝用Illustrator制作的可视化信息图,希望能帮你理清Javascript对象与__proto__.prototype和 ...

  8. [置顶] docker1.12--docker命令行帮助文档

    镜像操作 build 使用dockerfile方式创建镜像 使用dockerfile文件docker build dockerflle/,dockerfile文件默认位于dockerflle/Dock ...

  9. 6、Python模块

    最常用的两个模块: os    #可以允许python调用执行系统命令,如shell sys    #处理与python程序本身的事情   Python自带200多个常用模块 Python官网收集了2 ...

  10. Spring中如何配置事务

    学过SSH的都知道,整合了SSH之后,SSH的经典增删改查案例业务逻辑层的代码就十分简单.基本上都是一句话的事. public void addUser(Webuserlogin user) { // ...