一:背景

1. 讲故事

昨天群里有位朋友问:linq 查询的结果会开辟新的内存吗?如果开了,那是对原序列集里面元素的深拷贝还是仅仅拷贝其引用?

其实这个问题我觉得问的挺好,很多初学 C# 的朋友或多或少都有这样的疑问,甚至有 3,4 年工作经验的朋友可能都不是很清楚,这就导致在写代码的时候总是会畏手畏脚,还会莫名的揪心这样玩的话内存会不会暴涨暴跌,这一篇我就用 windbg 来帮助朋友彻底分析一下。

二:寻找答案

1. 一个小案例

这位老弟提到了是深拷贝还是浅拷贝,本意就是想问: linq 一个引用类型集合 到底会怎样? 这里我先模拟一个集合,代码如下:


class Program
{
static void Main(string[] args)
{
var personList = new List<Person>() {
new Person() { Name="jack", Age=20 },
new Person() { Name="elen",Age=25, },
new Person() { Name="john", Age=22 }
}; var query = personList.Where(m => m.Age > 20).ToList(); Console.WriteLine($"query.count={query.Count}"); Console.ReadLine();
}
} class Person
{
public string Name { get; set; } public int Age { get; set; }
}

2. 真的是深copy吗?

如果用 windbg 的话,就非常简单了,假设是深copy 的话,那么 query 之后,托管堆上就会有 5个 Person,那是不是这样呢? 用 !dumpheap -stat -type Person 到托管堆验证一下即可。


0:000> !dumpheap -stat -type Person
Statistics:
MT Count TotalSize Class Name
00007ff7f27c3528 1 64 System.Func`2[[ConsoleApp5.Person, ConsoleApp5],[System.Boolean, System.Private.CoreLib]]
00007ff7f27c2b60 2 64 System.Collections.Generic.List`1[[ConsoleApp5.Person, ConsoleApp5]]
00007ff7f27c9878 1 72 System.Linq.Enumerable+WhereListIterator`1[[ConsoleApp5.Person, ConsoleApp5]]
00007ff7f27c7a10 3 136 ConsoleApp5.Person[]
00007ff7f27c2ad0 3 96 ConsoleApp5.Person

从最后一行输出可以看到: ConsoleApp5.Person 的 Count=3,也就表明没有所谓的深copy,如果你还不信的话,可以在 query 中修改某一个Person的Age,看看原始的 personList 集合是不是同步更新,修改代码如下:


static void Main(string[] args)
{
var personList = new List<Person>() {
new Person() { Name="jack", Age=20 },
new Person() { Name="elen",Age=25, },
new Person() { Name="john", Age=22 }
}; var query = personList.Where(m => m.Age > 20).ToList(); //故意修改 Age=25 为 Age=100;
query[0].Age = 100; Console.WriteLine($"query[0].Age={query[0].Age}, personList[2].Age={personList[1].Age}"); Console.ReadLine();
}

从截图来看更加验证了 并没有所谓的 深copy 一说。

3. 真的是 copy 引用吗?

要验证是不是 copy 引用,最粗暴的方法就是看看 query 这个数组在 托管堆上的存储行态就明白了,同样你也可以借助 windbg 去验证一下,先到线程栈去找 query 变量,然后用 da 命令 对 query 进行打印。


0:000> !clrstack -l
OS Thread Id: 0x809c (0)
Child SP IP Call Site
000000E143D7E9B0 00007ff7f26f18be ConsoleApp5.Program.Main(System.String[]) [E:\net5\ConsoleApp5\ConsoleApp5\Program.cs @ 20]
LOCALS:
0x000000E143D7EA38 = 0x00000218266aab70
0x000000E143D7EA30 = 0x00000218266aad98 0:000> !do 0x00000218266aad98
Name: System.Collections.Generic.List`1[[ConsoleApp5.Person, ConsoleApp5]]
MethodTable: 00007ff7f27b2b60
EEClass: 00007ff7f27abad0
Size: 32(0x20) bytes
File: C:\Program Files\dotnet\shared\Microsoft.NETCore.App\3.1.9\System.Private.CoreLib.dll
Fields:
MT Field Offset Type VT Attr Value Name
0000000000000000 4001c35 8 SZARRAY 0 instance 00000218266aadb8 _items
00007ff7f26bb1f0 4001c36 10 System.Int32 1 instance 2 _size
00007ff7f26bb1f0 4001c37 14 System.Int32 1 instance 2 _version
0000000000000000 4001c38 8 SZARRAY 0 static dynamic statics NYI s_emptyArray 0:000> !da 00000218266aadb8
Name: ConsoleApp5.Person[]
MethodTable: 00007ff7f27b7a10
EEClass: 00007ff7f26b6580
Size: 56(0x38) bytes
Array: Rank 1, Number of elements 4, Type CLASS
Element Methodtable: 00007ff7f27b2ad0
[0] 00000218266aac00
[1] 00000218266aac20
[2] null
[3] null

从最后四行代码可以看出数组有 4 个格子,前2个格子放的是内存地址,后两个都是 null,可能有些朋友会问,query 不是 2 条记录吗? 怎么会有 4 个格子呢? 这是因为 query 是 List 结构,而 List 底层用的是数组,默认以 4 个格子起步,不信的话翻一下 List 原代码即可。


public class List<T>
{
private void EnsureCapacity(int min)
{
if (_items.Length < min)
{
int num = (_items.Length == 0) ? 4 : (_items.Length * 2); //默认 4 个大小
if ((uint)num > 2146435071u)
{
num = 2146435071;
}
if (num < min)
{
num = min;
}
Capacity = num;
}
}
}

如果你想进一步查看数组中前两个元素 00000218266aac00, 00000218266aac20 指向的是什么,可以用 !do 打印一下即可。


0:000> !do 00000218266aac00
Name: ConsoleApp5.Person
MethodTable: 00007ff7f27b2ad0
EEClass: 00007ff7f27c2a00
Size: 32(0x20) bytes
File: E:\net5\ConsoleApp5\ConsoleApp5\bin\Debug\netcoreapp3.1\ConsoleApp5.dll
Fields:
MT Field Offset Type VT Attr Value Name
00007ff7f2771e18 4000001 8 System.String 0 instance 00000218266aab30 <Name>k__BackingField
00007ff7f26bb1f0 4000002 10 System.Int32 1 instance 25 <Age>k__BackingField
0:000> !do 00000218266aac20
Name: ConsoleApp5.Person
MethodTable: 00007ff7f27b2ad0
EEClass: 00007ff7f27c2a00
Size: 32(0x20) bytes
File: E:\net5\ConsoleApp5\ConsoleApp5\bin\Debug\netcoreapp3.1\ConsoleApp5.dll
Fields:
MT Field Offset Type VT Attr Value Name
00007ff7f2771e18 4000001 8 System.String 0 instance 00000218266aab50 <Name>k__BackingField
00007ff7f26bb1f0 4000002 10 System.Int32 1 instance 22 <Age>k__BackingField

到这里为止,我觉得回答这位朋友的疑问应该是没有问题了,不过这里既然说到了集合中的引用类型,不得不说一下集合中的值类型又会是怎么样的?

三:集合中的值类型是什么样的copy方式

1. 使用 windbg 验证

有了上面的基础,验证这个问题的答案就简单了,先上测试代码


static void Main(string[] args)
{
var list = new List<int>() { 1, 2, 3, 4, 5, 6, 7,8,9,10 }; var query = list.Where(m => m > 5).ToList(); Console.ReadLine();
}

然后直接把整个数组内容打印出来


// list
0:000> !DumpArray /d 0000019687c8aba8
Name: System.Int32[]
MethodTable: 00007ff7f279f090
EEClass: 00007ff7f279f010
Size: 88(0x58) bytes
Array: Rank 1, Number of elements 16, Type Int32
Element Methodtable: 00007ff7f26cb1f0
[0] 0000019687c8abb8
[1] 0000019687c8abbc
[2] 0000019687c8abc0
[3] 0000019687c8abc4
[4] 0000019687c8abc8
[5] 0000019687c8abcc
[6] 0000019687c8abd0
[7] 0000019687c8abd4
[8] 0000019687c8abd8
[9] 0000019687c8abdc
[10] 0000019687c8abe0
[11] 0000019687c8abe4
[12] 0000019687c8abe8
[13] 0000019687c8abec
[14] 0000019687c8abf0
[15] 0000019687c8abf4 // query
0:000> !DumpArray /d 0000019687c8ae68
Name: System.Int32[]
MethodTable: 00007ff7f279f090
EEClass: 00007ff7f279f010
Size: 56(0x38) bytes
Array: Rank 1, Number of elements 8, Type Int32
Element Methodtable: 00007ff7f26cb1f0
[0] 0000019687c8ae78
[1] 0000019687c8ae7c
[2] 0000019687c8ae80
[3] 0000019687c8ae84
[4] 0000019687c8ae88
[5] 0000019687c8ae8c
[6] 0000019687c8ae90
[7] 0000019687c8ae94

仔细对比 list 和 query 的数组呈现,发现有两点好玩的信息:

  • 值类型和引用类型一样,数组中都是存放地址的。

  • 值类型数组中的所有格子都被填满,不像引用类型数组中还有 null 的情况。

接下来的问题是,数组中每个元素的地址到底指向了谁,可以挑出每个数组的 0 号元素地址,用 dp 命令看一看:


//list
0:000> dp 0000019687c8abb8
00000196`87c8abb8 00000002`00000001 00000004`00000003
00000196`87c8abc8 00000006`00000005 00000008`00000007
00000196`87c8abd8 0000000a`00000009 00000000`00000000 //query
0:000> dp 0000019687c8ae78
00000196`87c8ae78 00000007`00000006 00000009`00000008
00000196`87c8ae88 00000000`0000000a 00000000`00000000

看到没有,原来地址上面存放的都是数字值,深copy无疑哈。

四:总结

以上所有的分析可以得出:引用类型数组是引用copy,值类型数组是深copy,有时候背诵得来的东西总是容易忘记,只有实操验证才能真正的刻骨铭心!

linq 查询的结果会开辟新的内存吗?的更多相关文章

  1. LinqToDB 源码分析——轻谈Linq查询

    LinqToDB框架最大的优势应该是实现了对Linq的支持.如果少了这一个功能相信他在使用上的快感会少了一个层次.本来笔者想要直接讲解LinqToDB框架是如何实现对Linq的支持.写到一半的时候却发 ...

  2. C#基础:LINQ 查询函数整理

    1.LINQ 函数   1.1.查询结果过滤 :where() Enumerable.Where() 是LINQ 中使用最多的函数,大多数都要针对集合对象进行过滤,因此Where()在LINQ 的操作 ...

  3. 《Entity Framework 6 Recipes》中文翻译系列 (26) ------ 第五章 加载实体和导航属性之延缓加载关联实体和在别的LINQ查询操作中使用Include()方法

    翻译的初衷以及为什么选择<Entity Framework 6 Recipes>来学习,请看本系列开篇 5-7  在别的LINQ查询操作中使用Include()方法 问题 你有一个LINQ ...

  4. c# Linq查询

    c#提供的ling查询极大的遍历了集合的查询过程,且使用简单方便,非常的有用. 下面将分别用简单的例子说明:ling基本查询.延迟查询属性.类型筛选.复合from字句.多级排序.分组查询.联合查询.合 ...

  5. Linq查询表达式

    目录 1. 概述 2. from子句 3. where子句 4. select子句 5. group子句 6. into子句 7. 排序子句 8. let子句 9. join子句 10. 小结 1. ...

  6. .NET LINQ查询语法与方法语法

    LINQ 查询语法与方法语法      通过使用 C# 3.0 中引入的声明性查询语法,介绍性 LINQ 文档中的多数查询都被编写为查询表达式. 但是,.NET 公共语言运行时 (CLR) 本身并不具 ...

  7. Entity Framework 5中应用表值函数进行Linq查询

    Entity Framework 5引入了表值函数(Table-Valued Functions TVFs).表值函数的返回类型是一个Table类型,可用在SQL查询语句中.最简单的表值函数,读取客户 ...

  8. LINQ查询返回DataTable类型

    个人感觉Linq实用灵活性很大,参考一篇大牛的文章LINQ查询返回DataTable类型 http://xuzhihong1987.blog.163.com/blog/static/267315872 ...

  9. atitit. 集合groupby 的实现(2)---自定义linq查询--java .net php

    atitit.  集合groupby 的实现(2)---自定义linq查询--java .net php 实现方式有如下 1. Linq的实现原理流程(ati总结) 1 2. groupby  与 事 ...

随机推荐

  1. 基于Vue.js PC桌面端弹出框组件|vue自定义弹层组件|vue模态框

    vue.js构建的轻量级PC网页端交互式弹层组件VLayer. 前段时间有分享过一个vue移动端弹窗组件,今天给大家分享一个最近开发的vue pc端弹出层组件. VLayer 一款集Alert.Dia ...

  2. python之冒泡排序改进

    冒泡排序改进 关注公众号"轻松学编程"了解更多. 一.普通冒泡排序 [22,3,1,6,7,8,2,5] 普通冒泡排序 思路: 第一趟排序 从下标0开始,取出对应的值22 22和3 ...

  3. XML转换成TXT行数据的Java程序

    ZKe ------------------- XML数据的一个块内的所有属性,转换成TXT文件的一行.众所周知XML文件是通过类似HTML的标签进行数据的定义如图所示 属性由id, article, ...

  4. c#反转

    string[] arr = Console.ReadLine().Split(' '); string result = string.Empty; for (int i = arr.Count() ...

  5. AMA指标原作者Perry Kaufman 100+套交易策略源码分享

    更多精彩内容,欢迎关注公众号:数量技术宅.想要获取本期分享的完整策略代码,请加技术宅微信:sljsz01 AMA技术指标与原作者 Kaufman 说起 Perry Kaufman 这个名字,不少读者会 ...

  6. EFCore 5 新特性 `SaveChangesInterceptor`

    EFCore 5 新特性 SaveChangesInterceptor Intro 之前 EF Core 5 还没正式发布的时候有发布过一篇关于 SaveChangesEvents 的文章,有需要看可 ...

  7. 弹性盒模型flex-grow的计算

    flex-grow属性是弹性盒布局模块的子属性. 它定义了弹性项目在必要时增长的能力. 它接受作为比例的无单位值. 它决定了项目应在伸缩容器内部占用多少可用空间. 例如,如果所有项目的flex-gro ...

  8. IDEA与Eclipse创建struts项目

    1.IDEA创建struts项目 这里再构建struts项目是选择jar包出问题了,可以重新配置 创建页面和action配置struts.xml 启动tomcat,浏览器中运行 具体参考: https ...

  9. 《GNU_makefile》第七章——makefile的条件执行

    条件执行即,通过变量的值,来控制make的执行和忽略. 条件执行只能控制makefile的make语法部分,不能控制shell部分 1.一个例子 - libs_for_gcc = -lgnu norm ...

  10. Python博文_爬虫工程师是干什么的

    程序员有时候很难和外行人讲明白自己的工作是什么,甚至有些时候,跟同行的人讲清楚"你是干什么的"也很困难.比如我自己,就对Daivd在搞的语义网一头雾水.所以我打算写一篇博客,讲一下 ...