.NET遍历二维数组-先行/先列哪个更快？

上周在.NET性能优化群里面有一个很有意思的讨论，讨论的问题如下所示：

请教大佬：2D数组，用C#先遍历行再遍历列，或者先遍历列再遍历行，两种方式在性能上有区别吗？

据我所知，Julia或者python的 pandas，一般建议先遍历列，再遍历行

在群里面引发了很多大佬的讨论，总的来说观点分为以下三种：

应该不会有什么差别
先遍历列会比先遍历行更快
先遍历行会比先遍历列更快

看了群里面激烈的讨论，刚好今天有时间，我们就来看看真实情况是怎么样的？实践出真知，我们编写一个Benchmark一测便知。

测试

在下面的代码中，我们创建了一个 ArrayBenchmark 类，它包含了两个方法：RowFirst 和 ColumnFirst。这两个方法分别代表了先行后列和先列后行两种遍历方式。每次测试时，数组的大小将使用参数（Size）设置。在 Main 方法中，我们调用 BenchmarkRunner.Run 方法来运行测试。

using System;

using System.Diagnostics;

using BenchmarkDotNet.Attributes;

namespace TwoDimensionalArrayBenchmark

{

    public class ArrayBenchmark

    {

        private int[,] _array;

        [Params(1000, 2000, 4000, 8000, 16000)]

        public int Size { get; set; }

        [GlobalSetup]

        public void Setup()

        {

            _array = new int[Size, Size];

            var rnd = new Random();

            for (int i = 0; i < Size; i++)

            {

                for (int j = 0; j < Size; j++)

                {

                    _array[i, j] = rnd.Next();

                }

            }

        }

        [Benchmark]

        public int RowFirst()

        {

            // 先遍历一整行

            int sum = 0;

            for (int i = 0; i < Size; i++)

            {

                for (int j = 0; j < Size; j++)

                {

                    sum += _array[i, j];

                }

            }

            return sum;

        }

        [Benchmark]

        public int ColumnFirst()

        {

            // 先遍历一整列

            int sum = 0;

            for (int j = 0; j < Size; j++)

            {

                for (int i = 0; i < Size; i++)

                {

                    sum += _array[i, j];

                }

            }

            return sum;

        }

    }

    class Program

    {

        static void Main(string[] args)

        {

            var summary = BenchmarkDotNet.Running.BenchmarkRunner.Run<ArrayBenchmark>();

            Console.ReadKey();

        }

    }

}

得出的结果如下所示，从结果中我们可以看到，在.NET7.0中先遍历行远远快于先遍历列，随着数据量的增大有着近10倍的差距：

关于为什么先行后列的性能比先列后行高，猜测主要有以下两个原因：

CPU 缓存层次结构：当遍历二维数组时，先行后列方式更适合利用 CPU 的缓存层次结构。每次访问二维数组中的一行数据时，这一整行的数据都可以从 L1/L2/L3 缓存中读取，这样就可以大大提高数据读取的效率。
内存布局：二维数组的内存布局可能是按行存储的，也就是说一整行的数据在内存中是连续的。因此，先行后列的方式更容易利用内存的连续性，使数据读取更加顺畅。

我们可以通过简单的代码来验证一下.NET中二维数组的存储格式，使用Unsafe.AsPointer可以获取引用对象的指针，然后将其强转为long类型即可获得它的地址。

下面使用的是先行后列的遍历方式：

由于一个int类型占用4字节的空间，所以我们可以发现在使用先行后列的方式时刚好就是顺序顺序递增的。

也就是说C#在逻辑上虽然是二维数组，实际上存储是按每一行连续存储的，如下图所示：

CPU的缓存也是按照这个顺序进行缓存的，所以当我们先行后列遍历的时候整行数据都可能在CPU缓存中，可以最大化的利用好CPU缓存。

如果按照先列后行的遍历，那么对缓存就很不友好，需要多次从内存中读取数据。

总结

这就是本文的全部了，目前看来在C# .NET中遍历二维数组是先行快于先列，不过这也不是绝对的事情，因为在编译器和即时编译器中，是可以自动的去做一些优化，让程序更快的访问数据。比如在群里大佬们比较了在VC中的差异，结果是发现DEBUG模式确实行快于列，但是Release两者差别几乎可以忽略不计，当然这不在本文的讨论范围中。

.NET性能优化交流群

相信大家在开发中经常会遇到一些性能问题，苦于没有有效的工具去发现性能瓶颈，或者是发现瓶颈以后不知道该如何优化。之前一直有读者朋友询问有没有技术交流群，但是由于各种原因一直都没创建，现在很高兴的在这里宣布，我创建了一个专门交流.NET性能优化经验的群组，主题包括但不限于：

如何找到.NET性能瓶颈，如使用APM、dotnet tools等工具
.NET框架底层原理的实现，如垃圾回收器、JIT等等
如何编写高性能的.NET代码，哪些地方存在性能陷阱

希望能有更多志同道合朋友加入，分享一些工作中遇到的.NET性能问题和宝贵的性能分析优化经验。目前一群已满，现在开放二群。

如果提示已经达到200人，可以加我微信，我拉你进群: ls1075

另外也创建了QQ群，群号: 687779078，欢迎大家加入。

.NET遍历二维数组-先行/先列哪个更快？的更多相关文章

C/C++遍历二维数组，列优先(column-major)比行优先(row-major)慢，why？
C/C++遍历二维数组,列优先(column-major)比行优先(row-major)慢,why? 简单粗暴的答案:存在Cache机制! 稍微啰嗦一点:CPU访问内存(读/写,遍历数组的话主要是读) ...
PHP 距离我最近排序+二维数组按指定列排序
思路: 1.获取我的位置,即:我的经纬度 2.各站点须有位置即:排序对象有位置经纬度 3.查询要排序的站点列表 4.循环遍历计算与我的距离 5.二维数组按指定列(距离)排序具体如下: ...
for里面是采用setInterval遍历二维数组，for循环到最后一个数的时候，才执行setInterval的问题解决
点击播放看效果 <!doctype html> <html lang="en"> <head> <meta charset="U ...
C：指针遍历二维数组
C 指针遍历二维数组 http://blog.csdn.net/lcxandsfy/article/details/55000033 C++ 字符串指针与字符串数组 https://www.cnblo ...
三重for循环实现对二维数组的按列排序(JavaScript)
由C语言联想到的:三重for循环实现对二维数组的按列排序,并且牵扯到数据结构. 自己写的,水平有限,本文属于原创,可能存在错误,忘指正~ function circle() { var a = [ [ ...
php中遍历二维数组并以表格的形式输出
一.索引数组 <?php //使用array()语句结构将联系人列表中所有数据声明为一个二维数组,默认下标是顺序数字索引 $contact1 = array( //定义外层数组 array(1, ...
java基础之二维数组不定义列数
有一种特殊的二维数组,它的行数确定,但是每行的列数不确定.这样的的数组实现方法:先创建制定行数,列数缺省的二维数组,然后对数组的每一行重新初始化.举例如下: package day5; //第二种定义 ...
PHP二维数组--去除指定列含有重复项的数组
给定二维数组: $arr = array( '0' => array('张三',2,3,4), '1' => array('李四',2,3,4), '2' => array('张三' ...
php中foreach循环遍历二维数组
最近在用tp3.2框架,在查询的时候用到了select(),这条语句返回的是二维数组,所以在对返回的数据做处理时,遇到了些麻烦,百度了下foreach,终于用foreach解决了数据的筛选问题 (因为 ...
计算机二级-C语言-程序设计题-190119记录-求出一个二维数组每一列的最小值。
//编写一个函数:tt指向一个M行N列的二维数组,求出二维数组每列中最小的元素,并依次放入pp所指的一维数组中.二维数组中的数在主函数中赋予. //重难点:求出的是每一列的最小值,这里要注意,学会简化 ...

随机推荐

【题解】CF991C Candies
题面传送门解决思路看到 $10^{18}$ 的范围,我们可以想到二分答案.只要对于每一个二分出的答案进行 $check$ ,如果可行就往比它小的半边找,不可行就往比它大的半边找. 以下是 ...
Python的几种lambda排序方法
1.对单个变量进行排序 #lst = [[5,8],[5,3],[3,1]] lst.sort(key = lambda x : x[1]) #lst = [[3,1],[5,8],[5,3]] 以元 ...
golang基础语法学习
1.函数作为一等公民 2.驼峰命名法/大小写决定是否在包外见 3.包名应该是小写的单个单词命名 4. 包名应为其源码的基础名称,如encoding/base64,包名应为base64而不是encodi ...
django启动报错：DisallowedHost at /
学习django第一天,第一次启动服务就报错,报错内容如下: DisallowedHost at / Invalid HTTP_HOST header: '192.168.116.22:8000'. ...
ubuntu 22.04安装多个gcc
sudo apt install gcc-9 g++-9 sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-9 90 - ...
(GCC) gcc 编译选项 -fno-omit-frame-pointer，-fno-tree-vectorize，fno-optimize-sibling-calls；及内存泄漏、非法访问检测 ASAN
omit-frame-pointer 开启该选项,主要是用于去掉所有函数SFP(Stack Frame Pointer)的,即在函数调用时不保存栈帧指针SFP,代价是不能通过backtrace进行调试 ...
如何禁止win7自动锁屏
前言我是真的服了,就解决这个问题百度查了一大堆(浪费很长时间),都说是电源管理的问题,也不知道是谁抄谁的,改完还会自动锁屏. 然后我google一下子就解决了(这里有一个搜索技巧,就是将你的问题翻译 ...
SSH(五)spring整合hibernate
一.创建hibernate实体映射文件. 在实体所在包创建映射文件product.hbm.xml,引入hibernate的映射约束.(该约束位于hibernate3.jar里面hibernate-ma ...
详解 Redis 中 big keys 发现和解决
在使用 Redis 时,可能会出现请求响应慢.网络卡顿.数据丢失的情况.排查问题的时候,发现是 big keys 的问题. 什么是 big keys 在 Redis 中,一个字符串类型最大可以达到 5 ...
分享一个你很可能不知道的Java异常实现的缺陷
前言 Java中一个大家熟知的知识点就是异常捕获,try...catch...finally组合,但是很多人不知道这里面有一个关于Java的缺陷,或者说是异常实现的一点不足之处. 我这边就通过一个很简 ...

.NET遍历二维数组-先行/先列哪个更快？

测试

总结

.NET性能优化交流群

.NET遍历二维数组-先行/先列哪个更快？的更多相关文章

随机推荐

热门专题