基于MPI的大规模矩阵乘法问题
转载请注明出处。
/*
Function:C++实现并行矩阵乘法;
Time: 19/03/25;
Writer:ZhiHong Cc;
*/
运行方法:切到工程文件x64\Debug文件下,打开命令行,输入以下指令:
mpiexec -n N Project.exe NUM
// N代表开启进程数量,NUM代表矩阵规模大小(size)
具体代码:
1.头文件:
#include<stdio.h>
#include <iostream>
#include<math.h>
#include<mpi.h>
#include<time.h>
2.矩阵规模(size)接收,通过C++自带参数argv和argc[ ]:
if (argv == 2)
{
//判断有无矩阵大小size接收,无则初始化为5
size = atoi(argc[1]);
}
else { size = 5; }
3.为各指针变量分配空间
int *a, *b, *c, *pce, *ans;
a = (int*)malloc(sizeof(int)*size*size);//矩阵a
b = (int*)malloc(sizeof(int)*size*size);//矩阵b
c = (int*)malloc(sizeof(int)*size*size);//结果矩阵
pce = (int*)malloc(sizeof(int)*size*line);//接收a矩阵下的块矩阵
ans = (int*)malloc(sizeof(int)*size*line);//暂存次进程的答案
4.定义进程号,进程个数以及块矩阵的行数
int rank, numprocess, line;
line = size / numprocess;//将数据分为(进程数)个块,主进程也要处理数据
5.主进程中进行一系列操作:生成矩阵、分配矩阵、接收次进程答案、拼接答案、计算耗时、最终输出三个矩阵
for (int i = 0; i<size; i++)
{
for (int j = 0; j<size; j++)
{
//随机两个相乘的矩阵a,b
a[i*size + j] = random(10);
b[i*size + j] = random(10);
}
}
for (int i = 1; i<numprocess; i++)
{
//将b矩阵传递给各进程
MPI_Send(b, size*size, MPI_INT, i, 0, MPI_COMM_WORLD);
}
for (int i = 1; i<numprocess; i++)
{
//将a矩阵分成块矩阵,传递给各进程
MPI_Send(a + (i - 1)*line*size, size*line, MPI_INT, i, 1, MPI_COMM_WORLD);
}
for (int k = 1; k<numprocess; k++)
{
MPI_Recv(ans, line*size, MPI_INT, k, 2, MPI_COMM_WORLD, MPI_STATUS_IGNORE);
//接收传递结果到数组c
for (int i = 0; i<line; i++)
{
for (int j = 0; j<size; j++)
{
c[((k - 1)*line + i)*size + j] = ans[i*size + j];
}
}
}
for (int i = (numprocess - 1)*line; i<size; i++)
{
//计算分配给主进程的块矩阵
for (int j = 0; j<size; j++)
{
int temp = 0;
for (int k = 0; k<size; k++)
{
temp += a[i*size + k] * b[k*size + j];
}
c[i*size + j] = temp;
}
}
for (int i = 0; i < size; i++)
{
//打印显示
for (int j = 0; j<size; j++) { printf("%d ", a[size*i + j]); }printf(" ");
for (int j = 0; j<size; j++) { printf("%d ", b[size*i + j]); }printf(" ");
for (int j = 0; j<size; j++) { printf("%d ", c[size*i + j]); }printf("\n");
}
endtime = MPI_Wtime();
printf("Took %f secodes.\n", endtime - starttime);
}
6.次进程中进行此类操作:接收相乘矩阵,计算答案传送给主进程
MPI_Recv(b, size*size, MPI_INT, 0, 0, MPI_COMM_WORLD, MPI_STATUS_IGNORE);
//接收b矩阵
MPI_Recv(pce, size*line, MPI_INT, 0, 1, MPI_COMM_WORLD, MPI_STATUS_IGNORE);
//接收块矩阵
for (int i = 0; i<line; i++)
{
//计算块矩阵与b矩阵相乘的结果
for (int j = 0; j<size; j++)
{
int temp = 0;
for (int k = 0; k<size; k++)
temp += pce[i*size + k] * b[k*size + j];
ans[i*size + j] = temp;
}
}
MPI_Send(ans, line*size, MPI_INT, 0, 2, MPI_COMM_WORLD);
//将结果传递到主进程
运行:开启10个进程处理两个12×12的矩阵相乘问题

运行:直接运行,不录入参数

欢迎大家在评论区提问或者指出问题!
基于MPI的大规模矩阵乘法问题的更多相关文章
- 基于MPI的并行计算—矩阵向量乘
以前没接触过MPI编程,对并行计算也没什么了解.朋友的期末课程作业让我帮忙写一写,哎,实现结果很一般啊.最终也没完整完成任务,惭愧惭愧. 问题大概是利用MPI完成矩阵和向量相乘.输入:Am×n,Bn× ...
- MPI编程——分块矩阵乘法(cannon算法)
https://blog.csdn.net/a429367172/article/details/88933877
- 基于OpenMP的矩阵乘法实现及效率提升分析
一. 矩阵乘法串行实现 例子选择两个1024*1024的矩阵相乘,根据矩阵乘法运算得到运算结果.其中,两个矩阵中的数为double类型,初值由随机数函数产生.代码如下: #include <i ...
- 矩阵乘法的MPI并行计算
1.问题描述 矩阵乘法问题描述如下: 给定矩阵A和B,其中A是m*p大小矩阵,B是p*n大小的矩阵.求C = A*B. 求解这个问题最简单的算法是遍历A的行和B的列,求得C的相应元素,时间复杂度O(m ...
- [转]OpenBLAS项目与矩阵乘法优化
课程内容 OpenBLAS项目介绍 矩阵乘法优化算法 一步步调优实现 以下为公开课完整视频,共64分钟: 以下为公开课内容的文字及 PPT 整理. 雷锋网的朋友们大家好,我是张先轶,今天主要介绍一下我 ...
- 【BZOJ-4386】Wycieczki DP + 矩阵乘法
4386: [POI2015]Wycieczki Time Limit: 20 Sec Memory Limit: 128 MBSubmit: 197 Solved: 49[Submit][Sta ...
- OpenGL学习进程(12)第九课:矩阵乘法实现3D变换
本节是OpenGL学习的第九个课时,下面将详细介绍OpenGL的多种3D变换和如何操作矩阵堆栈. (1)3D变换: OpenGL中绘制3D世界的空间变换包括:模型变换.视图变换.投影变换和视口 ...
- MapReduce实现矩阵乘法
简单回想一下矩阵乘法: 矩阵乘法要求左矩阵的列数与右矩阵的行数相等.m×n的矩阵A,与n×p的矩阵B相乘,结果为m×p的矩阵C.具体内容能够查看:矩阵乘法. 为了方便描写叙述,先进行如果: 矩阵A的行 ...
- MapReduce实现大矩阵乘法
来自:http://blog.csdn.net/xyilu/article/details/9066973 引言 何 为大矩阵?Excel.SPSS,甚至SAS处理不了或者处理起来非常困难,需要设计巧 ...
随机推荐
- php 合并图片 (将活动背景图片和动态二维码图片合成一张图片)
<?php //案例一:将活动背景图片和动态二维码图片合成一张图片 //图片一 $path_1 = './background.png'; //图片二 $path_2 = './FU0851_2 ...
- Beyond Compare 3添加右键菜单
目前是在Beyond Compare 3.1.9版本上试验可行,其他版本上尚未测试. 添加右键菜单步骤: 1.新建为.bat后缀的文本,将下面“添加右键菜单批处理”复制到此文本中. 2.将批处理移动到 ...
- php使用insert语句动态添加用户
<html> <head> <title>Adding User</title> </head> <body> <h2&g ...
- input框在浏览器上显示一个叉,去掉方法
/* 清除IE10及以上版本input的叉叉(X)和密码输入框的眼睛图标 */ input::-ms-clear { display: none; } input::-ms-reveal { disp ...
- 采用Anaconda平台调用pymc3时出现错误的解决方法
提示:(1)module 'theano' has no attribute 'gof',c++编辑出现错误 (2)stdio.h file not found 解决方法:(1)在终端中输入 xcod ...
- P1041 传染病控制(dfs)
P1041 传染病控制 题目背景 近来,一种新的传染病肆虐全球.蓬莱国也发现了零星感染者,为防止该病在蓬莱国大范围流行,该国政府决定不惜一切代价控制传染病的蔓延.不幸的是,由于人们尚未完全认识这种传染 ...
- oracle函数操作
感于总有些网友提出一些非常基础的问题,比如有没有实现某某功能的函数啊,某某函数是做什么用的啊,格式是什么等等,同时也感受到自己对oracle函数认识的不足,于是集中月余时间专注于oracle函数,小有 ...
- js中正则表达式使用
js中使用正则表达式,除了了解正则表达式基本的匹配规则外.还需要了解下面的基本的知识: python,js,groovy这些脚本语言都有在线调试的网站,可以在线测试是否有语法错误,用起来也很方便. v ...
- spring框架篇(一)-------spring简介与配置文件使用控制反转事例
spring简介 Spring 是一个开源框架,中文意思就是春天,也许是作者想让自己的这个框架给Java开发人员带来春天吧.其官方网站是 https://spring.io/ ,可以在官方网站下载到完 ...
- C语言排序算法学习笔记——选择类排序
选择排序:每一趟(例如第i趟)在后面n-i+1(i=1,2,3,……,n-1)个待排序元素中选取关键字最小的元素,作为有序子序列的第i个元素,直到n-1趟做完,待排序元素只剩下1个,就不用再选了. 简 ...