Matrix multiplication

Time Limit: 4000/2000 MS (Java/Others) Memory Limit: 131072/131072 K (Java/Others)
Total Submission(s): 5236 Accepted Submission(s): 2009

Problem Description

Given two matrices A and B of size n×n, find the product of them.

bobo hates big integers. So you are only asked to find the result modulo 3.

Input

The input consists of several tests. For each tests:

The first line contains n (1≤n≤800). Each of the following n lines contain n integers -- the description of the matrix A. The j-th integer in the i-th line equals A_ij. The next n lines describe the matrix B in similar format (0≤A_ij,B_ij≤10⁹).

Output

For each tests:

Print n lines. Each of them contain n integers -- the matrix A×B in similar format.

Sample Input

0 1

2 3

4 5

6 7

Sample Output

0 1

2 1

Author

Xiaoxu Guo (ftiasch)

Source

2014 Multi-University Training Contest 5

题目就是裸的矩阵乘法。

代码:

 #include<iostream>

 #include<cstdio>

 #include<algorithm>

 #include<cstring>

 #include<cstdlib>

 #include<string.h>

 #include<set>

 #include<vector>

 #include<queue>

 #include<stack>

 #include<map>

 #include<cmath>

 using namespace std;

 int a[][],b[][],c[][];

 int main(){

     int n;

     while(~scanf("%d",&n)){

         for(int i=;i<n;i++)

             for(int j=;j<n;j++){

                 scanf("%d",&a[i][j]);

                 a[i][j]%=;

                 c[i][j]=;

             }

         for(int i=;i<n;i++)

             for(int j=;j<n;j++){

                 scanf("%d",&b[i][j]);

                 b[i][j]%=;

             }

         for(int i=;i<n;i++)

             for(int j=;j<n;j++){

                 if(!a[i][j])continue;//判断优化

                 for(int k=;k<n;k++)

                     c[i][k]=c[i][k]+a[i][j]*b[j][k];

             }

         for(int i=;i<n;i++){

             for(int j=;j<n;j++)

                 if(j==n-)printf("%d\n",c[i][j]%);

                 else printf("%d ",c[i][j]%);

         }

     }

         return ;

 }

看其他题解

这个题有两种解法，一种是先对矩阵进行%3，

然后在3次方循环里判断如果元素如果是0，则continue不进行乘积的累加的结果。能起到优化的作用。

还有一种就是对矩阵进行某一个进行转置后，再进行两个矩阵的乘积累加。也能起到优化。

代码:

 #include<iostream>

 #include<cstring>

 #include<cmath>

 #include<cstdio>

 #include<algorithm>

 using namespace std;

 int a[][],b[][],c[][];

 int main(){

     int n;

     while(~scanf("%d",&n)){

         for(int i=;i<n;i++)

             for(int j=;j<n;j++){

                 scanf("%d",&a[i][j]);

                 a[i][j]%=;

                 c[i][j]=;

             }

         for(int i=;i<n;i++)

             for(int j=;j<n;j++){

                 scanf("%d",&b[i][j]);

                 b[i][j]%=;

             }

         for(int i=;i<n;i++)

             for(int j=;j<n;j++)

             swap(b[i][j],b[j][i]);//转置优化

         for(int i=;i<n;i++)

             for(int j=;j<n;j++){

                 //if(!a[i][j])continue;

                 for(int k=;k<n;k++)

                     c[i][k]=c[i][k]+a[i][j]*b[j][k];

             }

         for(int i=;i<n;i++){

             for(int j=;j<n;j++)

                 if(j==n-)printf("%d\n",c[i][j]%);

                 else printf("%d ",c[i][j]%);

         }

     }

         return ;

 }

用转置的话，也可以继续用3次方循环里判断元素是否为0，continue来优化。

直接判断的优化，时间跑1279MS，用转置不用判断是1653MS，用转置也用判断是1482MS，emnnnn。。。

 for(int i=;i<n;i++)

              for(int j=;j<n;j++){

                  for(int k=;k<n;k++)

                      c[i][k]=c[i][k]+a[i][j]*b[j][k];

              }

如果是按这种循环写，不管有没有在3次方循环里判断元素是否为0，或者不管有没有转置，都不会超时！！！

然后就是还发现了一个问题，如果三层循环里面写的是c[i][j]的循环会超时的。

 for(int i=;i<n;i++)

              for(int j=;j<n;j++){

                  for(int k=;k<n;k++)

                      c[i][j]=c[i][j]+a[i][k]*b[k][j];

              }

这个题简直有毒啊。

不管是直接判断优化还是转置优化，还是转置+判断优化，都是超时。

在经过这么多次智障操作之后(之后又交了一发，一共23次)，并且在记录了循环的次数之后！！！

我发现。。。

             int num=;

         for(int i=;i<n;i++)

             for(int j=;j<n;j++){

                 //if(!a[i][j])continue;

                 for(int k=;k<n;k++){

                     c[i][k]=c[i][k]+a[i][j]*b[j][k];

                     num++;

                 }

             }

在都不经过优化的情况下，num的次数都是一样的，两个循环的次数都是一样的。

为什么一个可以过，一个就超时呢？？？(所有的都测过了_(:з」∠)_ )
未解之谜啊啊啊啊啊啊啊啊啊啊啊啊啊啊_(:з」∠)_

玩不了玩不了。。。

由于C与C++的二维数组是以行为主序存储的。

因此矩阵a的行数据元素是连续存储的,而矩阵b的列数据元素是不连续存储的(N*1的矩阵除外),

为了在矩阵相乘时对矩阵b也连续读取数据,根据局部性原理对矩阵b进行转置。

然而并没有什么用，在不转置的情况下，c[i][k]的是两个按行的，c[i][j]是一个按行的。c[i][k]比c[i][j]快我可以理解。但是！！！

转置之后，c[i][k]是两个按列的，c[i][j]是一个按行的，按道理应该是c[i][j]的快啊，但是为什么还是c[i][k]]快啊。

啊啊啊啊啊啊啊，玩不了玩不了。

传送门:虽然名字叫矩阵乘法优化，然而并没有什么用

HDU4920-Matrix multiplication-矩阵乘法 51nod-1137 矩阵乘法的更多相关文章

hdu4920 Matrix multiplication 模3矩阵乘法
hdu4920 Matrix multiplication Time Limit: 4000/2000 MS (Java/Others) Memory Limit: 131072/131072 ...
51nod 1137.矩阵乘法-矩阵乘法
1137 矩阵乘法基准时间限制:1 秒空间限制:131072 KB 分值: 0 难度:基础题给出2个N * N的矩阵M1和M2,输出2个矩阵相乘后的结果. Input 第1行:1个数N, ...
51nod 1137 矩阵乘法【矩阵】
1137 矩阵乘法基准时间限制:1 秒空间限制:131072 KB 分值: 0 难度:基础题收藏关注给出2个N * N的矩阵M1和M2,输出2个矩阵相乘后的结果. Input 第1行 ...
HDU-4920 Matrix multiplication
矩阵相乘,采用一行的去访问,比采用一列访问时间更短,根据数组是一行去储存的.神奇小代码. Matrix multiplication Time Limit: 4000/2000 MS (Java/Ot ...
51nod 1137 矩阵乘法
基本的矩阵乘法中间for(int j=0;i<n;i++) //这里写错了应该是j<n 晚上果然效率不行等会早点儿睡 //矩阵乘法就是两个矩阵第一个矩阵的列等与第 ...
HDU4920 Matrix multiplication 矩阵
不要问窝为什么过了> < 窝也不造为什么就过了说是%3变成稀疏矩阵可是随便YY个案例都会超时.. . 看来数据是随机的诶 #include <stdio.h> #incl ...
【bitset】hdu4920 Matrix multiplication
先把两个矩阵全都mod3. S[i][j][k]表示第i(0/1)个矩阵的行/列的第k位是不是j(1/2). 然后如果某两个矩乘对应位上为1.1,乘出来是1: 1.2:2: 2.1:2: 2.2:1. ...
矩阵乘法 --- hdu 4920 ： Matrix multiplication
Matrix multiplication Time Limit: 4000/2000 MS (Java/Others) Memory Limit: 131072/131072 K (Java/ ...
hdu 4920 Matrix multiplication（矩阵乘法）2014多培训学校5现场
Matrix multiplication Time ...
数学（矩阵乘法，随机化算法）：POJ 3318 Matrix Multiplication
Matrix Multiplication Time Limit: 2000MS Memory Limit: 65536K Total Submissions: 17783 Accepted: ...

随机推荐

Struts2学习---简单的数据校验、访问Web元素
1.简单的数据校验在action里面我们已经给出了一个数据校验: public String execute() { if(user.getUsername().equals("usern ...
chmod 命令详解
chmod 作用:修改目录或文件权限(= 赋值不管存在与否, + 增加权限)符号链接的权限无法变更, 如果用户对符号链接修改权限, 其改变会作用在被链接的原始文件. 参数: -R: 递归修改处理 -v ...
java的运行机制（基础）
1:高级语言的运行机制: 我们编程都是用的高级语言(写汇编和机器语言的大牛们除外),计算机不能直接理解高级语言,只能理解和运行机器语言,所以必须要把高级语言翻译成机器语言,计算机才能运行高级语言所编写 ...
Python 项目实践三（Web应用程序）第三篇
接着上节的继续学习,现在要显示所有主题的页面有了高效的网页创建方法,就能专注于另外两个网页了:显示全部主题的网页以及显示特定主题中条目的网页.所有主题页面显示用户创建的所有主题,它是第一个需要使用数 ...
[编织消息框架][网络IO模型]Netty Reactor
严格来讲Netty Reactor是一种设计模式,一听模式两字就知道了吧,套路哈哈 Reactor中文译为“反应堆”. 看图netty处理流程 1.netty server 至少有两组reactor. ...
Git详解之三：Git分支
Git 分支几乎每一种版本控制系统都以某种形式支持分支.使用分支意味着你可以从开发主线上分离开来,然后在不影响主线的同时继续工作.在很多版本控制系统中,这是个昂贵的过程,常常需要创建一个源代码目录的 ...
使用svn 的解决处理svn状态冲突
当直接只用版本浏览器进行svn的删除操作是,在客户端svn目录里,出现svn版本错误信息提示,使用 svn 解决命令,处理冲突保存 svn resolve --accept=working PATH( ...
房上的猫：switch选择结构，与选择结构总结
switch选择结构: 一.定义: switch选择结构,可以方便地解决等值判断问题二.语法: switch(表达式){ case 常量1: //代码块1; break; c ...
微信小程序开发之模板消息
一.添加模板登录https://mp.weixin.qq.com获取模板,如果没有合适的模板,可以申请添加新模板,审核通过后可使用,详见模板审核说明页面的 <form/> 组件,属性r ...
Tableau的简单数据可视化操作
本文将讲解Tableau的基本使用和简单的数据分析. 在Tableau首页,我们可以看到有多种连接方式:文本文件.Excel.JSON文件.数据库等. 1.连接文本文件点击"连接" ...

HDU4920-Matrix multiplication-矩阵乘法 51nod-1137 矩阵乘法

Matrix multiplication

HDU4920-Matrix multiplication-矩阵乘法 51nod-1137 矩阵乘法的更多相关文章

随机推荐

热门专题