1、count和any

今天看了鹤冲天的文章:Linq:切勿使用 Count() > 0 来判断集合非空   有所收获,写下文章总结一下:

先看如下代码:

        static void Main(string[] args)
{
Stopwatch watch = new Stopwatch();
watch.Start();
var nums = GetNums(, );
SomeAction(nums);
watch.Stop();
Console.WriteLine(watch.ElapsedMilliseconds);
Console.WriteLine("over");
Console.ReadKey();
}
public static IEnumerable<int> GetNums(int start, int count)
{
var end = start + count;
for (int i = start; i < end; i++)
yield return i;
}
public static void SomeAction<T>(IEnumerable<T> source)
{
//if (source.Count() > 0) //2233 毫秒
if (source.Any()) //3 毫秒
{
Console.WriteLine("have data");
}
}

自己调试了下,当yield循环低于100000次的话,count()和Any()的执行时间差不多,count()时间略大于any()所耗费的时间,当大于100000次的话,count()执行时间就远比Any()执行时间多很多!例如上面的程序执行结果,count耗时2233毫秒,any却只耗时3毫秒!这是为什么呢?我们来看下原因:分别反编译 Enumerate.Count 的源码和 Enumerate.Any的源码,如下:

Enumerate.Any 实现代码如下:

 public static bool Any<TSource>(this IEnumerable<TSource> source)
{
if (source == null)
{
throw Error.ArgumentNull("source");
}
using (IEnumerator<TSource> enumerator = source.GetEnumerator())
{
if (enumerator.MoveNext())
{
return true;
}
}
return false;
}

Enumerate.Count 的源码如下:

 public static int Count<TSource>(this IEnumerable<TSource> source)
{
if (source == null)
{
throw Error.ArgumentNull("source");
}
ICollection<TSource> is2 = source as ICollection<TSource>;
if (is2 != null)
{
return is2.Count;
}
ICollection is3 = source as ICollection;
if (is3 != null)
{
return is3.Count;
}
int num = ;
using (IEnumerator<TSource> enumerator = source.GetEnumerator())
{
while (enumerator.MoveNext())
{
num++;
}
}
return num;
}

无论循环多少次,Any方法执行的时间总是最少的,大概10毫秒之内,我想大家从Any的源码可以知道这个原因,Any方法先判断集合是否为空,然后判断集合是否有数据,只进行一次movenext(),并未进行循环查询集合数量!所以耗费的时间当然一直是最少的了!

我们再看Count方法,同样是先进行集合判空操作,然后判断当前的集合source是否能转成ICollection类型,如果能转成,就直接返回此集合的Count属性,不会在进行下面的循环获取集合个数的操作了,为什么Count()方法比Any()方法执行的时间长呢?答案就在于此:因为GetNums方法中用yield返回纯粹的IEnumerable<int>类型,但是ICollection<T>是继承自IEnumerable<T>类型的,所以必然不好被转换,也就是Count()源码中的下面代码不会执行

     ICollection is3 = source as ICollection;
if (is3 != null)
{
return is3.Count;
}

上面的代码不会执行,那么必然会进行下面的代码操作,也就是循环获取集合的个数:

     int num = ;
using (IEnumerator<TSource> enumerator = source.GetEnumerator())
{
while (enumerator.MoveNext())
{
num++;
}
}
return num;

这样必然会导致Count()方法耗时很久!

2、如果我们把GetNums进行如下修改,其他代码不动:

       public static IEnumerable<int> GetNums(int start, int count)
{
List<int> list = new List<int>();
var end = start + count;
for (int i = start; i < end; i++)
list.Add(i);
return list;
}

这时我们在执行程序,可以看到无论循环次数多少,Count和Any两者执行的时间差不多,大概是1315毫秒左右,其中1312毫秒用于list集合的装填工作,3毫秒用于Count或Any的判断时间,为什么会出现这种情况呢,我想通过上面大家都知道了,因为此时GetNums方法返回的是List<T>类型,此类型继承于ICollection,所以必然可以被转换,就会返回此类型的Count属性,Count 方法对 ICollection 进行了优化,直接访返回它的 Count 属性,也就是返回一个数,当然很快了,下面的循环获取集合的个数当然也就不会执行了,也就节约了时间。

3、对某人问题的思考

有人说:”我有个程序里经常要判集合里是否仅有一个元素,又不能用Count,不得已自己写了个扩展方法 bool Check(this IEnumerable<T> source, int n), 当读到第n+1个元素就直接返回false“

我想如果此人用的集合是继承于ICollection<T>的话,例如List<T>,那么是没必要对IEnumerable<T>进行扩展的,通过反编译Count源码可以知道,如果集合source可以转换成ICollection的话,是可以直接通过count属性获取到集合的总数量的,所以耗费的时间要不了多少,也就没必要对IEnumerable进行扩展了!反之,如果不是继承ICollection<T>的话,例如IEnumerable,就必须自己扩展IEnumerable方法了,如果还用count的话,就会造成循环了,也就降低了程序的运行效率了!

4、参考

http://www.cnblogs.com/ldp615/archive/2011/12/11/2284154.html#comment_tip  鹤冲天

作者:MrZivChu

2013-12-13   21:30:12

Linq中Count()和Any()引发的效率问题的更多相关文章

  1. MVC+Spring.NET+NHibernate .NET SSH框架整合 C# 委托异步 和 async /await 两种实现的异步 如何消除点击按钮时周围出现的白线? Linq中 AsQueryable(), AsEnumerable()和ToList()的区别和用法

    MVC+Spring.NET+NHibernate .NET SSH框架整合   在JAVA中,SSH框架可谓是无人不晓,就和.NET中的MVC框架一样普及.作为一个初学者,可以感受到.NET出了MV ...

  2. Linq中关键字的作用及用法

    Linq中关键字的作用及用法 1.All:确定序列中的所有元素是否都满足条件.如果源序列中的每个元素都通过指定谓词中的测试,或者序列为空,则为 true:否则为 false. Demo: 此示例使用 ...

  3. Linq 中按照多个值进行分组(GroupBy)

    Linq 中按照多个值进行分组(GroupBy) .GroupBy(x => new { x.Age, x.Sex }) group emp by new { emp.Age, emp.Sex ...

  4. SQL语句中count(1)count(*)count(字段)用法的区别

    SQL语句中count(1)count(*)count(字段)用法的区别 在SQL语句中count函数是最常用的函数之一,count函数是用来统计表中记录数的一个函数, 一. count(1)和cou ...

  5. linq中AsEnumerable和AsQueryable的区别

    本文导读:用Linq来操作集合的时候会用到AsQueryable()和AsEnumerable(),何时该用AsQueryable()和何时该用AsEnumerable(),或许存在些疑惑.AsQue ...

  6. Linq中使用Left Join

    use Test Create table Student( ID ,) primary key, ) not null ) Create Table Book( ID ,) primary key, ...

  7. 简述Linq中.ToList(), .AsEnumerable(), AsQueryable()的区别和用法

    [TOC] 这3个方法的功能完全不同, 应按照具体业务场景使用. AsQueryable() 先说说什么是 IQueryable IQueryable 是当前的 data provider 返回的类型 ...

  8. linq中group by

    本文导读:LINQ定义了大约40个查询操作符,如select.from.in.where.group 以及order by,借助于LINQ技术,我们可以使用一种类似SQL的语法来查询任何形式的数据.L ...

  9. Linq中 AsQueryable(), AsEnumerable()和ToList()的区别和用法

    Linq中 AsQueryable(), AsEnumerable()和ToList()的区别和用法:在写LINQ语句的时候,往往会看到AsEnumerable() ,AsQueryable() 和T ...

随机推荐

  1. oracle 创建SDO_Geometry表

    Oracle Spatial由一坨的对象数据类型,类型方法,操作子,函数与过程组合而成.一个地理对象作为一个SDO_GEOMETRY对象保存在表的一个字段里.空间索引则由普通的DDL和DML语句来建立 ...

  2. 最长上升子序列&&最长不下降子序列

    百练2757: 题目描述: 对于给定的序列,求出最长上升子序列的长度. 题目链接:http://bailian.openjudge.cn/practice/2757 解题思路 一.动态规划 1. 找子 ...

  3. 2019.03.15 ZJOI2019模拟赛 解题报告

    得分: \(20+45+15=80\)(三题暴力全写挂...) \(T1\):Lyk Love painting 首先,不难想到二分答案然后\(DP\)验证. 设当前需验证的答案为\(x\),则一个暴 ...

  4. python 合并字符串

    [root@chenbj python]# cat name.py #!/usr/bin/env python # _*_ coding:utf-8 _*_ first_name = "ch ...

  5. 20145238-荆玉茗 《Java程序设计》实验三

    20145238-荆玉茗-实验三 实验三 敏捷开发与XP实践 实验内容 XP基础 XP核心实践 相关工具 实验步骤 (一)敏捷开发与XP 软件工程是把系统的.有序的.可量化的方法应用到软件的开发.运营 ...

  6. 关于IDataReader.GetSchemaTable的一些事情

    http://stackoverflow.com/questions/1574492/how-does-getschematable-work The implementation of IDataR ...

  7. 旧文备份:AVR读写EEPROM分析

    由于AVR的EEPROM写周期比较长(一般为毫秒级),因此在编程使用过程中要特别注意.对于读EEPROM没什么好说的,读一个字节的数据要耗费4个时钟周期,可以忍受,写就比较麻烦了,虽然放在EEPROM ...

  8. 项目 XXX 受源代码管理。向源代码管理注册此项目时出错。建议不要对此项目进行任何修改

    原本带vss或者svn管理的项目独立复制出来后,如果出现下面问题 解决办法: 使用记事本打开,项目csproj文件删除图中

  9. 史上最简单的SpringCloud教程 | 第三篇: 服务消费者(Feign)

    转载请标明出处: https://www.fangzhipeng.com/springcloud/2017/07/12/sc03-feign/ 本文出自方志朋的博客 最新Finchley版本请访问: ...

  10. 【赛时总结】◇赛时·VII◇ Atcoder ABC-106

    [赛时·VII] ABC-106 一条比赛时莫名其妙发了半个小时呆的菜鸡&咸鱼得到了自己应有的下场……279th. Rating:1103(+) 终于AK,一次通过…… ◇ 简单总结 ABC还 ...