Matrix multiplication

Time Limit: 4000/2000 MS (Java/Others) Memory Limit: 131072/131072 K (Java/Others)
Total Submission(s): 5236 Accepted Submission(s): 2009

Problem Description

Given two matrices A and B of size n×n, find the product of them.

bobo hates big integers. So you are only asked to find the result modulo 3.

Input

The input consists of several tests. For each tests:

The first line contains n (1≤n≤800). Each of the following n lines contain n integers -- the description of the matrix A. The j-th integer in the i-th line equals A_ij. The next n lines describe the matrix B in similar format (0≤A_ij,B_ij≤10⁹).

Output

For each tests:

Print n lines. Each of them contain n integers -- the matrix A×B in similar format.

Sample Input

0 1

2 3

4 5

6 7

Sample Output

0 1

2 1

Author

Xiaoxu Guo (ftiasch)

Source

2014 Multi-University Training Contest 5

题目就是裸的矩阵乘法。

代码:

 #include<iostream>

 #include<cstdio>

 #include<algorithm>

 #include<cstring>

 #include<cstdlib>

 #include<string.h>

 #include<set>

 #include<vector>

 #include<queue>

 #include<stack>

 #include<map>

 #include<cmath>

 using namespace std;

 int a[][],b[][],c[][];

 int main(){

     int n;

     while(~scanf("%d",&n)){

         for(int i=;i<n;i++)

             for(int j=;j<n;j++){

                 scanf("%d",&a[i][j]);

                 a[i][j]%=;

                 c[i][j]=;

             }

         for(int i=;i<n;i++)

             for(int j=;j<n;j++){

                 scanf("%d",&b[i][j]);

                 b[i][j]%=;

             }

         for(int i=;i<n;i++)

             for(int j=;j<n;j++){

                 if(!a[i][j])continue;//判断优化

                 for(int k=;k<n;k++)

                     c[i][k]=c[i][k]+a[i][j]*b[j][k];

             }

         for(int i=;i<n;i++){

             for(int j=;j<n;j++)

                 if(j==n-)printf("%d\n",c[i][j]%);

                 else printf("%d ",c[i][j]%);

         }

     }

         return ;

 }

看其他题解

这个题有两种解法，一种是先对矩阵进行%3，

然后在3次方循环里判断如果元素如果是0，则continue不进行乘积的累加的结果。能起到优化的作用。

还有一种就是对矩阵进行某一个进行转置后，再进行两个矩阵的乘积累加。也能起到优化。

代码:

 #include<iostream>

 #include<cstring>

 #include<cmath>

 #include<cstdio>

 #include<algorithm>

 using namespace std;

 int a[][],b[][],c[][];

 int main(){

     int n;

     while(~scanf("%d",&n)){

         for(int i=;i<n;i++)

             for(int j=;j<n;j++){

                 scanf("%d",&a[i][j]);

                 a[i][j]%=;

                 c[i][j]=;

             }

         for(int i=;i<n;i++)

             for(int j=;j<n;j++){

                 scanf("%d",&b[i][j]);

                 b[i][j]%=;

             }

         for(int i=;i<n;i++)

             for(int j=;j<n;j++)

             swap(b[i][j],b[j][i]);//转置优化

         for(int i=;i<n;i++)

             for(int j=;j<n;j++){

                 //if(!a[i][j])continue;

                 for(int k=;k<n;k++)

                     c[i][k]=c[i][k]+a[i][j]*b[j][k];

             }

         for(int i=;i<n;i++){

             for(int j=;j<n;j++)

                 if(j==n-)printf("%d\n",c[i][j]%);

                 else printf("%d ",c[i][j]%);

         }

     }

         return ;

 }

用转置的话，也可以继续用3次方循环里判断元素是否为0，continue来优化。

直接判断的优化，时间跑1279MS，用转置不用判断是1653MS，用转置也用判断是1482MS，emnnnn。。。

 for(int i=;i<n;i++)

              for(int j=;j<n;j++){

                  for(int k=;k<n;k++)

                      c[i][k]=c[i][k]+a[i][j]*b[j][k];

              }

如果是按这种循环写，不管有没有在3次方循环里判断元素是否为0，或者不管有没有转置，都不会超时！！！

然后就是还发现了一个问题，如果三层循环里面写的是c[i][j]的循环会超时的。

 for(int i=;i<n;i++)

              for(int j=;j<n;j++){

                  for(int k=;k<n;k++)

                      c[i][j]=c[i][j]+a[i][k]*b[k][j];

              }

这个题简直有毒啊。

不管是直接判断优化还是转置优化，还是转置+判断优化，都是超时。

在经过这么多次智障操作之后(之后又交了一发，一共23次)，并且在记录了循环的次数之后！！！

我发现。。。

             int num=;

         for(int i=;i<n;i++)

             for(int j=;j<n;j++){

                 //if(!a[i][j])continue;

                 for(int k=;k<n;k++){

                     c[i][k]=c[i][k]+a[i][j]*b[j][k];

                     num++;

                 }

             }

在都不经过优化的情况下，num的次数都是一样的，两个循环的次数都是一样的。

为什么一个可以过，一个就超时呢？？？(所有的都测过了_(:з」∠)_ )
未解之谜啊啊啊啊啊啊啊啊啊啊啊啊啊啊_(:з」∠)_

玩不了玩不了。。。

由于C与C++的二维数组是以行为主序存储的。

因此矩阵a的行数据元素是连续存储的,而矩阵b的列数据元素是不连续存储的(N*1的矩阵除外),

为了在矩阵相乘时对矩阵b也连续读取数据,根据局部性原理对矩阵b进行转置。

然而并没有什么用，在不转置的情况下，c[i][k]的是两个按行的，c[i][j]是一个按行的。c[i][k]比c[i][j]快我可以理解。但是！！！

转置之后，c[i][k]是两个按列的，c[i][j]是一个按行的，按道理应该是c[i][j]的快啊，但是为什么还是c[i][k]]快啊。

啊啊啊啊啊啊啊，玩不了玩不了。

传送门:虽然名字叫矩阵乘法优化，然而并没有什么用

HDU 4920.Matrix multiplication-矩阵乘法的更多相关文章

HDU 4920 Matrix multiplication(矩阵相乘)
各种TEL,233啊.没想到是处理掉0的情况就能够过啊.一直以为会有极端数据.没想到居然是这种啊..在网上看到了一个AC的奇妙的代码,经典的矩阵乘法,仅仅只是把最内层的枚举,移到外面就过了啊...有点 ...
HDU 4920 Matrix multiplication 矩阵相乘。稀疏矩阵
Matrix multiplication Time Limit: 4000/2000 MS (Java/Others) Memory Limit: 131072/131072 K (Java/ ...
HDU 4920 Matrix multiplication（bitset)
HDU 4920 Matrix multiplication 题目链接题意:给定两个矩阵,求这两个矩阵相乘mod 3 思路:没什么好的想法,就把0的位置不考虑.结果就过了.然后看了官方题解,上面是用 ...
hdu 4920 Matrix multiplication（矩阵乘法）2014多培训学校5现场
Matrix multiplication Time ...
hdu 4920 Matrix multiplication bitset优化常数
Matrix multiplication Time Limit: 4000/2000 MS (Java/Others) Memory Limit: 131072/131072 K (Java/ ...
HDU 4920 Matrix multiplication（bitset优化）
题目链接 Matrix multiplication 求矩阵A和B相乘的结果. 因为答案只要对3取模,所以我们可以通过一些方法来加速计算. 我们对两个矩阵各开两个bitset,分别存储模3余1和模3余 ...
2014多校第五场1010 || HDU 4920 Matrix multiplication（矩阵乘法优化）
题目链接题意 : 给你两个n*n的矩阵,然后两个相乘得出结果是多少. 思路 :一开始因为知道会超时所以没敢用最普通的方法做,所以一直在想要怎么处理,没想到鹏哥告诉我们后台数据是随机跑的,所以极端数据 ...
HDU 4920 Matrix multiplication （硬件优化）
题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=4920 解题报告:求两个800*800的矩阵的乘法. 参考这篇论文:http://wenku.baidu ...
hdu - 4920 - Matrix multiplication（缓存优化+开挂）
题意:求两个n x n的矩阵相乘后模3的结果,n <= 800. 题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=4920 -->>呀呀 ...

随机推荐

4G来临，短视频社交分享应用或井喷
因为工作的原因,接触短视频社交应用的时间相对较多,不管是自家的微视,还是别人家的Vine.玩拍.秒拍等,都有体验过.随着时间的推移,我愈发感受到有一股似曾相识的势能正在某个地方慢慢积聚,直到今天我才猛 ...
《Cracking the Coding Interview》——第4章：树和图——题目3
2014-03-19 03:34 题目:给定一个排好序的数组,设计算法将其转换为一棵二叉搜索树,要求树的高度最小. 解法:递归生成平衡二叉树,使左右子树的节点数尽量相等,所以对半开最好了.其实也可以生 ...
PC Server远程管理卡用户管理脚本实现
1.IPMI工作原理图: 2.脚本实现流程图: 3.适配服务器机型: 4.演示效果: 5.实现代码: #!/usr/bin/env bash # Author : JACK ZHAO # Date : ...
（原)UE4 制作执行队列（Action Queue)
队列和树在游戏开发中是比较常见的数据结构,在一定范围能保证执行的顺序. 结合一些设计模式技巧,往往可以做一些神器. 如加载块chunk管理,任务系统(当然也可以使用行为树来做复杂的任务系统). ...
leetcode 149. 直线上最多的点数解题报告
给定一个二维平面,平面上有 n 个点,求最多有多少个点在同一条直线上. 示例 1: 输入: [[1,1],[2,2],[3,3]] 输出: 3 解释: ^ | | o | o | o +------- ...
团队项目-第八次scrum 会议
时间:11.4 时长:30分钟地点:F楼2层沙发休息处工作情况团队成员已完成任务待完成任务解小锐修复员工招聘时bug 完成员工commit函数的数值函数编写陈鑫实现雇佣与解雇功能的界 ...
kibana的查询语法
kibana的查询语法是字段Fields:关键词
jQuery基础知识点（下）
在实际开发中,jQuery的实践性非常强大.上一篇本人已经整理出了一部分基础知识点,该文即是对以上的补充和扩展. 1.表单值的操作 //获取文本框的值 //txt.value var val = $( ...
PHP面向对象单例模式（懒汉式）
知识点: 一.三私一公: ①.私有静态属性,又来储存生成的唯一对象 ②.私有构造函数 ③.私有克隆函数,防止克隆——clone ④.公共静态方法,用来访问静态属性储存的对象,如果没有对象,则生成此单例 ...
[CF463D]Gargari and Permutations
题目大意:给你$k(2\leqslant k\leqslant5)$个$1\sim n(n\leqslant10^3)$的排列,求它们的最长子序列题解:将$k$个排列中每个元素的位置记录下来.如果是 ...

HDU 4920.Matrix multiplication-矩阵乘法

Matrix multiplication

HDU 4920.Matrix multiplication-矩阵乘法的更多相关文章

随机推荐

热门专题