『性能』List 和 HashSet 查找性能比较（任何数据量的检索从此只用 HashSet ）

结论：

总数 50000 （5万）： List 检索 5W次耗时 23秒， HashSet 检索 5W次耗时 0.01秒。

总数 5000 （5千）： List 检索 5K次耗时 0.16秒， HashSet 检索 5K次耗时 0.001秒。

总数 500 （5百）： List 检索 500次耗时 0.004秒， HashSet 检索 500次耗时 0.000秒。

总数 50 ： List 检索 50次耗时 0.002秒， HashSet 检索 500次耗时 0.000秒。

集合查找元素，

当总数超过 10 时， HashSet<T> 的检索性能就会比 List<T> 快。

当总数超过 1000 时， List<T> 的检索性能会急速下降。

当总数超过 10000 时， List<T> 将会以秒为单位的损失性能。

换言之：

> 无论怎样的数据量， HashSet<T> 的检索速度都要比 List<T> 快。（不存在那种：多少数据量以下，List 有优势，多少数据量以上，HashSet 有优势）

> Hastable 的查找性能 == HashSet 的查找性能，用不了 HashSet 可以用 Hashtable 替换。

背景：

今天在项目中，需要用到一个检索功能，只需要判断指定的关键字是否存在。

第一本能就想到了 HashSet<T> 对象。

但，HashSet<T> 是 .Net 4.0 的东西，我希望自己的代码无限兼容 .Net 2.0 —— 所以想避开这个东西。

其实，我的关键字最多不过 20个，但是检索次数比较多 —— 所以，我就想看一下 List 和 HashSet 查找的分水岭在哪里。

测试代码：

         static void Main(string[] args)

         {

             List<string> list = new List<string>();

             HashSet<string> hash = new HashSet<string>();

             //数据准备

             for (int i = ; i < ; i++)

             {

                 string str = Guid.NewGuid().ToString();

                 list.Add(str);

                 hash.Add(str);

             }

             Console.WriteLine("数据准备完成");

             //list 的查找性能

             DateTime time0 = DateTime.Now;

             bool result0 = true;

             foreach (string str in list)

             {

                 bool v = list.Contains(str); //list 的查找性能

                 result0 = result0 && v;

             }

             DateTime time1 = DateTime.Now;

             Console.WriteLine("从 {0} 的 List<string> 中, 判断数据是否存在, 耗时: {1}", list.Count, (time1 - time0).TotalSeconds);

             //hash 的查找性能

             DateTime time2 = DateTime.Now;

             bool result1 = true;

             foreach (string str in list)

             {

                 bool v = hash.Contains(str); //hash 的查找性能

                 result1 = result1 && v;

             }

             DateTime time3 = DateTime.Now;

             Console.WriteLine("从 {0} 的 HashSet<string> 中, 判断数据是否存在, 耗时: {1}", hash.Count, (time3 - time2).TotalSeconds);

             Console.ReadKey();

         }

运行截图：

Hashtable 性能：

.Net 2.0 没有 HashSet，但是有 Hashtable 和 Dictionary

Hashtable 支持 Key查找和 Value查找

             //hashtable - key 的查找性能

             DateTime time4 = DateTime.Now;

             bool result2 = true;

             foreach (string str in list)

             {

                 bool v = hash2.ContainsKey(str); //hashtable - key 的查找性能

                 result2 = result2 && v;

             }

             DateTime time5 = DateTime.Now;

             Console.WriteLine("从 {0} 的 Hashtable 中, 判断Key是否存在, 耗时: {1}", hash2.Count, (time5 - time4).TotalSeconds);

             //hashtable - value 的查找性能

             DateTime time6 = DateTime.Now;

             bool result3 = true;

             foreach (string str in list)

             {

                 bool v = hash2.ContainsValue(str); //hashtable - value 的查找性能

                 result3 = result3 && v;

             }

             DateTime time7 = DateTime.Now;

             Console.WriteLine("从 {0} 的 Hashtable 中, 判断Value是否存在, 耗时: {1}", hash2.Count, (time7 - time6).TotalSeconds);

测试结果如下：

『性能』List 和 HashSet 查找性能比较（任何数据量的检索从此只用 HashSet ）的更多相关文章

『性能』测试一下 MSSqlHelper 的性能
本文没啥技术含量,就是测试一下 MSSqlHelper 在使用反射.不使用反射的性能对比. 之后,不要问为什么不用 ORM 这类的东西 —— 会有另外的文章介绍自己这些年自己的ORM 升级历 ...
『Numpy』内存分析_高级切片和内存数据解析
在计算机中,没有任何数据类型是固定的,完全取决于如何看待这片数据的内存区域. 在numpy.ndarray.view中,提供对内存区域不同的切割方式,来完成数据类型的转换,而无须要对数据进行额外的co ...
【SQL server初级】数据库性能优化一：数据库自身优化（大数据量）
数据库优化包含以下三部分,数据库自身的优化,数据库表优化,程序操作优化.此文为第一部分数据库性能优化一:数据库自身优化优化①:增加次数据文件,设置文件自动增长(粗略数据分区) 1.1:增加次数据文 ...
『MXNet』第六弹_Gluon性能提升
一.符号式编程 1.命令式编程和符号式编程命令式: def add(a, b): return a + b def fancy_func(a, b, c, d): e = add(a, b) f = ...
『MXNet』第六弹_Gluon性能提升静态图动态图符号式编程命令式编程
https://www.cnblogs.com/hellcat/p/9084894.html 目录一.符号式编程 1.命令式编程和符号式编程 2.MXNet的符号式编程二.惰性计算用同步函数实际 ...
『TensorFlow』SSD源码学习_其四：数据介绍及TFR文件生成
Fork版本项目地址:SSD 一.数据格式介绍数据文件夹命名为VOC2012,内部有5个子文件夹,如下, 我们的检测任务中使用JPEGImages文件夹和Annotations文件夹. JPEGIm ...
『MXNet』专题汇总
MXNet文档 MXNet官方教程持久化模型框架介绍『MXNet』第一弹_基础架构及API 『MXNet』第二弹_Gluon构建模型『MXNet』第三弹_Gluon模型参数『MXNet』第四 ...
『TensorFlow』SSD源码学习_其一：论文及开源项目文档介绍
一.论文介绍读论文系列:Object Detection ECCV2016 SSD 一句话概括:SSD就是关于类别的多尺度RPN网络基本思路: 基础网络后接多层feature map 多层feat ...
Tair LDB基于Prefixkey中期范围内查找性能优化项目总结
"Tair LDB基于Prefixkey该范围内查找性能优化"该项目是仅一个月.这个月主要是熟悉项目..以下从几个方面总结下个人在该项目上所做的工作及自己的个人所得所感. 项目工作 ...

随机推荐

C#文件和字节流的转换方法
1.读取文件,并转换为字节流 FileStream fs = new FileStream(filename,FileMode.Open,FileAccess.Read); byte[] infbyt ...
Spring结合log4j(slf4j)
maven依赖  <dependency> <groupId> ...
JQuery（三）-- AJAX的深入理解以及JQuery的使用
HTTP HTTP http: 超文本传输协议.特点: 简单.快速.灵活.无状态.无连接 URL: 统一资源定位符. 组成:协议名://主机IP:端口号/项目资源地址?传递参数的键值对#锚点 ①ip ...
Quartz学习--二 Hello Quartz! 和源码分析
Quartz学习--二 Hello Quartz! 和源码分析三. Hello Quartz! 我会跟着第一章 6.2 的图来进行同步代码编写简单入门示例: 创建一个新的java普通工程 ...
在mac OX10.11.6上安装MySQL
一.之前失败情况官网下载dmg文件安装.源码安装,下过5.6 5.7 8.0 版本,都可以安装成功,但是在电脑设置界面无法启动,每次点启动输入密码后,均闪一下绿色然后变红色,既然不能界面启动,那 ...
解决MyEclipse注册失败的问题
https://jingyan.baidu.com/article/acf728fd49519ff8e410a361.html
【转】利用 force index优化sql语句性能
今天写了一个统计sql,在一个近亿条数据的表上执行,200s都查不出结果.SQL如下: select customer,count(1) c from upv_** where created bet ...
.Net Core微服务系列--理论篇
微服务的由来微服务最早由Martin Fowler与James Lewis于2014年共同提出来的,但是微服务也不是一个全新的概念,它是由一系列在实践中获得成功并流行起来的概念中总结出来的一种模式, ...
关于checkpoint
Ⅰ.Checkpoint 1.1 checkpoint的作用缩短数据库的回复时间缓冲池不够用时,将脏页刷到磁盘重做日志不可用时,刷新脏页 1.2 展开分析 page被缓存在bp中,page在bp ...
DCOS实践分享(4)：如何基于DC/OS整合SMACK(Spark, Mesos, Akka, Cassandra, Kafka)
这篇文章入选CSDN极客头条 http://geek.csdn.net/news/detail/71572 当前,要保证业务的市场竞争力,仅靠设计一个可用并且好看的产品,已经完全不能满足要求.全球消费 ...

『性能』List 和 HashSet 查找性能比较 （任何数据量的检索 从此只用 HashSet ）

『性能』List 和 HashSet 查找性能比较 （任何数据量的检索 从此只用 HashSet ）的更多相关文章

随机推荐

热门专题

『性能』List 和 HashSet 查找性能比较（任何数据量的检索从此只用 HashSet ）

『性能』List 和 HashSet 查找性能比较（任何数据量的检索从此只用 HashSet ）的更多相关文章