80755386

.net core的代码位置

https://github.com/dotnet/corefx/blob/master/src/Common/src/CoreLib/System/Collections/Generic/Dictionary.cs

C#中，Dictionary这个数据结构并不是很容易理解，因为看上不去并不像C++的map。底层是如何实现一个字典的并完全可知，因为从数据结构来说，很多结构都可以支持一个类似的加速key-value对存储的访问形式。比如tree，跳表，hashtable等等。

基于bucket的Hashtable

Dictionary的基本思想是通过一个Entry数值存储数据（key和value），其中的数据是紧密排布的。然后，通过bucket数组实现hashcode加速查找。如果两个对象的hashcode%length（数值的长度）相等，实现类似hashtable碰撞的退避规则，并通过Entry.next的引用住新的退避位置（用数组下标实现连接）。

private struct Entry

{

public int hashCode; // Lower 31 bits of hash code, -1 if unused

public int next; // Index of next entry, -1 if last

public TKey key; // Key of entry

public TValue value; // Value of entry

}

private int[] _buckets;

private Entry[] _entries;

一个key-value数据，在经过Key.GetHashCode后的返回值，再对_buckets的长度取模。决定隐射到的_buckets下标，而实际存储的区域_entries是一个连续存储的数组，用来存储键值对（Entry）。如上图，如果插入时出现hash桶碰撞，会直接找到下一个空的格子插入数据，并把这个格子的id保存到上一个entry.next中，方便删除或查找时使用。

反之，如果删除数据时，就需要级联更新entry.next的情况。删除的关键代码如下，如果是一个通过next找到的entry，那last必然>0，所以需要把last.next指向自己的next，绕过自己。如果last<0则说明，自己是第一个元素，直接更新bucket指向自己的next（可能是-1，也可能是真的下一个元素的下标）。

if (last < )

        {

            // Value in buckets is 1-based

            buckets[bucket] = entry.next + ;

        }

        else

        {

            entries[last].next = entry.next;

        }

关于Keys和Values

private KeyCollection _keys;
private ValueCollection _values;

许多时候，我们会用到对Keys和Values的访问。那我们来看看，这两个属性是如何实现的。先看一下KeyCollection的实现。这里删除了一些多余的代码，可以看出，他仅仅对dict的一个组合关系，内部的实际工作者是dict。

public sealed class KeyCollection : ICollection<TKey>, ICollection, IReadOnlyCollection<TKey>

{

private Dictionary<TKey, TValue> _dictionary;

public KeyCollection(Dictionary<TKey, TValue> dictionary)

{

_dictionary = dictionary;

}

void ICollection<TKey>.Add(TKey item)

=> ThrowHelper.ThrowNotSupportedException(ExceptionResource.NotSupported_KeyCollectionSet);

void ICollection<TKey>.Clear()

=> ThrowHelper.ThrowNotSupportedException(ExceptionResource.NotSupported_KeyCollectionSet);

bool ICollection<TKey>.Contains(TKey item)

=> _dictionary.ContainsKey(item);

}

    然后，看一下迭代过程的实现。非常简单，仅仅是每次都把_currentKey赋值为_entries的下一个元素。所以，可以看出来，Keys的访问是有序的（按插入顺序）。

public bool MoveNext()

{

while ((uint)_index < (uint)_dictionary._count)

{

ref Entry entry = ref _dictionary._entries[_index++];

if (entry.hashCode >= )

{

_currentKey = entry.key;

return true;

}

}

_index = _dictionary._count + ;

_currentKey = default;

return false;

}

values和keys的实现是完全一致的，所以Values的访问和Keys的访问性能是差不多的，不存在访问Keys快，访问Values慢的情况。

关于空间大小算法

大家知道hash表是需要先分配一块比较大的空间，并在保持一定数据密度的情况下，会拥有比较高的存储和访问效率。

C#的dict，永远会去找当前需求的capacity的下一个素数，作为数组的分配size。如果，默认new Dict，传递的capacity是0，那么实际此时的_entries大小是3。

找素数的逻辑稍微提下。会先顺序遍历存储的primes数组；如果找不到，再用逐个数字遍历的方式找接下来的素数。

public static readonly int[] primes = {

, , , , , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , ,

, , , , , , , , , , , , ,

, , , , , , , , , , , ,

, , , , , , , ,  };

关于读取数据的效率

题外话，讲一下有的同学喜欢这么写数据访问的代码。

if (techAddonDict.ContainsKey())

{

var c = techAddonDict[];

}

从底层来说，所有查找的代码，都会先通过bucket找到一次entry对象（通过FindEntry函数）。那么上一段函数中实际需要访问两次FindEntry函数。

float v;

if (techAddonDict.TryGetValue(3, out v))

{

//todo xxx

}

这段函数就很明显了，只需要访问一次FindEntry函数，性能自然会好一倍。

通过.net core源码看下Dictionary的实现的更多相关文章

一起来看CORE源码（一） ConcurrentDictionary
先贴源码地址 https://github.com/dotnet/corefx/blob/master/src/System.Collections.Concurrent/src/System/Col ...
ASP.NET Core[源码分析篇] - Authentication认证
原文:ASP.NET Core[源码分析篇] - Authentication认证追本溯源,从使用开始首先看一下我们通常是如何使用微软自带的认证,一般在Startup里面配置我们所需的依赖认证服务 ...
从源码看JDK提供的线程池（ThreadPoolExecutor）
一丶什么是线程池 (1)博主在听到线程池三个字的时候第一个想法就是数据库连接池,回忆一下,我们在学JavaWeb的时候怎么理解数据库连接池的,数据库创建连接和关闭连接是一个比较耗费资源的事情,对于那些 ...
一个由正则表达式引发的血案 vs2017使用rdlc实现批量打印 vs2017使用rdlc [asp.net core 源码分析] 01 - Session SignalR sql for xml path用法 MemCahe C# 操作Excel图形——绘制、读取、隐藏、删除图形 IOC,DIP,DI,IoC容器
1. 血案由来近期我在为Lazada卖家中心做一个自助注册的项目,其中的shop name校验规则较为复杂,要求:1. 英文字母大小写2. 数字3. 越南文4. 一些特殊字符,如“&”,“- ...
源码分析之Dictionary笔记
接下来我们一步步来熟悉 Dictionary的底层结构实现,下面的MyDictionary等同于源码中的Dictionary看待. 首先我们定义一个类 MyDictionary,类中定义一个结构Ent ...
从微信小程序开发者工具源码看实现原理（一）- - 小程序架构设计
使用微信小程序开发已经很长时间了,对小程序开发已经相当熟练了:但是作为一名对技术有追求的前端开发,仅仅熟练掌握小程序的开发感觉还是不够的,我们应该更进一步的去理解其背后实现的原理以及对应的考量,这可能 ...
DOTNET CORE源码分析之IOC容器结果获取内容补充
补充一下ServiceProvider的内容可能上一篇文章DOTNET CORE源码分析之IServiceProvider.ServiceProvider.IServiceProviderEngin ...
从Linux源码看Socket(TCP)的listen及连接队列
从Linux源码看Socket(TCP)的listen及连接队列前言笔者一直觉得如果能知道从应用到框架再到操作系统的每一处代码,是一件Exciting的事情. 今天笔者就来从Linux源码的角度看 ...
从源码看Azkaban作业流下发过程
上一篇零散地罗列了看源码时记录的一些类的信息,这篇完整介绍一个作业流在Azkaban中的执行过程,希望可以帮助刚刚接手Azkaban相关工作的开发.测试. 一.Azkaban简介 Azkaban作为开 ...

随机推荐

centos 安装 python flask 和python3安装flask
pip install Flask python3安装 pip3 install flask
Linux alien命令
一.简介 alien是一个用于在各种不同的Linux包格式相互转换的工具,其最常见的用法是将.rpm转换成.deb(或者反过来). 二.安装 http://toutiao.com/a618899776 ...
Django框架之 ORM查询操作详解
Django框架之 ORM查询操作详解浏览目录一般操作 ForeignKey操作 ManyToManyField 聚合查询分组查询 F查询和Q查询事务 Django终端打印SQL语句在Py ...
无法认识patch请求
Content-Type: application/vnd.api+jsonbase64:账号密码的设置总结:该及时消化的知识,就应该当时消化.不能拖.注意细节,一个小细节的疏忽,导致自己几乎一天的时 ...
重构get请求代码---PartyLocation
将原理在PersonDto中定义的partyLocations,剪切到PartyDto中去. @JsonApiToMany private List<PartyLocationDto> p ...
Dev Envirenment - VS Code && C++ && MinGW
1. 安装编译器安装 MinGW-W64 添加系统环境变量注意: 1)安装 MinGW 的时候要选择正确的 CPU 处理器类型 2)添加系统变量后需要重启电脑系统 2. 安装本文编辑器安装 VS ...
vue2.x学习笔记
1.使用模板template的时候必须要有跟节点,可以支持表达式,但不支持正则,想使用正则就用过滤器. 2.数据在显示的时候所带的HTML DOM直接显示,不会渲染,要渲染DOM,得用v-html. ...
搭建TensorFlow
网上有许多在线安装TensorFlow框架的,我试了好多,结果安装时间长先不说,还总是出现一些问题,然后我就想着离线安装,成功了,与大家分享! (1)首先,需要下载离线安装的TensorFlow包,可 ...
String类-小用
字符串-string (1)string在Java中是一个引用类型,string变量可引用一个字符串对象 (2) 例1: s0,s1,s2引用同一个对象 New创建的两个string是不同的对象只是内 ...
duddo在xml里面出现红叉的解决方法
原因是没有加入dubbo.xsd window-Preferences-输入xml-xmltacalog....... 配置离线约束:http://code.alibabatech.com/schem ...

通过.net core源码看下Dictionary的实现

https://blog.csdn.net/narlon/article/details/80755386

关于空间大小算法

关于读取数据的效率

通过.net core源码看下Dictionary的实现的更多相关文章

随机推荐

热门专题