本文是.Net 并行计算 的第三篇 欢迎大家拍砖,阅读本文需要有LINQ基础,因为并行LINQ (PLinq) 其实是LINQ To Object 的并行实现

  • 什么是并行LINQ

PLinq 其实就是Linq to Object 的并行实现,PLINQ 会尝试充分利用系统的处理。将数据源分片之后,而后在多个处理上进行处理,这就意味着在大部分情况下运行速度会显著提高,PLINQ 通常只需向数据源添加 AsParallel()查询操作,这个还是很简单的吧 下面的例子为大家展示了这点

           List<int> TestDemo = Enumerable.Range(1, 10000).ToList();
Stopwatch w1 = Stopwatch.StartNew();
var linqParallel = from c in TestDemo.AsParallel() where c % 2 == 0 select c;
int count = linqParallel.ToList().Count;
Console.WriteLine("并行Linq耗时" + w1.ElapsedMilliseconds + "找到偶数:" + count);

大家知道上面的例子是怎么执行的吗?其实在默认的情况下PLinq是保守的。他会先分析总体结构和的并行查询是否安全,如果并行查询性能因为并行而提高而且安全的话就会使用并行查询。否则就会顺序执行,当然你也可以直接指定使用并行查询。

 var linqParallel = from c in TestDemo.AsParallel().WithExecutionMode(ParallelExecutionMode.ForceParallelism) where c % 2 == 0 select c;
  • 影响PLINQ查询性能的因素

1.总体工作的计算开销

首先大家都明白并行化会有性能的开销所以PLINQ的查询的必须要有足够的运算来弥补这样的开开销,如果运算量很小则不适合使用PLINQ;大家看看下面的例子,才看看运行结果 是PLINQ 的时间多还是LINQ的时间多,在笔者的电脑中并行LINQ 所需时间要大于非并行LINQ

1
2
3
4
5
6
7
List<int> TestDemo = Enumerable.Range(1, 1000000).ToList();
 Stopwatch w1 = Stopwatch.StartNew();
 var linqParallel = from num in TestDemo.AsParallel() where  num / 3 == 0 select num;
 Console.WriteLine("并行Linq耗时" + w1.ElapsedMilliseconds );
 Stopwatch w2 = Stopwatch.StartNew();
 var linql = from num in TestDemo where num / 3 == 0 select num;
 Console.WriteLine("非并行Linq耗时" + w2.ElapsedMilliseconds );

如果我们做如下修改,那么PLINQ的性能优势立即就显现出来了,因为在SELECT的语句有足够的工作来抵消并行带来的性能开销

 private static int MyTest(int a)
{ Thread.Sleep(1000);
Random r= new Random(1000);
return r.Next();
}
            List<int> TestDemo = Enumerable.Range(1, 100).ToList();
Stopwatch w1 = Stopwatch.StartNew();
var linqParallel = from num in TestDemo.AsParallel() where num / 3 == 0 select MyTest(num);
Console.WriteLine("并行Linq耗时" + w1.ElapsedMilliseconds );
Stopwatch w2 = Stopwatch.StartNew();
var linql = from num in TestDemo where num / 3 == 0 select MyTest(num);
Console.WriteLine("非并行Linq耗时" + w2.ElapsedMilliseconds );
Console.ReadLine();

2.系统的逻辑内核
       这个地方我好想很好理解,一样代码,你在4核心机器上和8核心的机器上,肯定是8核跑的快些原因是可以在更多并行线程之间分担工作加速的总量取决于查询的总体工作中可并行化的百分比。  但是,请不要假定所有查询在八核计算机上的运行速度都比在四核计算机的运行速度快两倍在PLINQ中我们可以指定使用处理器的个数但是最多不能操过64个如下例中

1
var linqParallel = from num in TestDemo.AsParallel().WithDegreeOfParallelism(2) where num / 3 == 0 select MyTest(num);

3.查询的执行方式

这里在后面会讲到,现在就不说了。

4.操作数量和种类

对于必须要保持元素在源序列中的顺序的情况,PLINQ 提供了 AsOrdered 运算符。 排序会产生开销,但此开销通常是适度的。  GroupBy 和 Join 操作同样也会产生开销。  如果允许按任意顺序处理源集合中的元素,并在这些元素就绪时立即将它们传递到下一个运算符

 
 
分类: .Net

并行Linq(一)的更多相关文章

  1. C#5.0之后推荐使用TPL(Task Parallel Libray 任务并行库) 和PLINQ(Parallel LINQ, 并行Linq). 其次是TAP(Task-based Asynchronous Pattern, 基于任务的异步模式)

    学习书籍: <C#本质论> 1--C#5.0之后推荐使用TPL(Task Parallel Libray 任务并行库) 和PLINQ(Parallel LINQ, 并行Linq). 其次是 ...

  2. C# 多线程八之并行Linq(ParallelEnumerable)

    1.简介 关于并行Linq,Ms官方叫做并行语言集成(PLINQ)查询,其实本质就是Linq的多线程版本,常规的Linq是单线程的,也就是同步的过程处理完所有的查询.如果你的Linq查询足够简单,而且 ...

  3. C#编程(六十三)----------并行LINQ

    并行LINQ .NET4在System.Linq命名空间中包含一个新类ParallelEnumerable,可以分解查询的工作使其分布在多个线程上.尽管Enumerable类给IEnumerable& ...

  4. 并行Linq

    有时候我们对大批量数据进行处理,此时并行linq就起作用了. 并行查询 对于以下查询可以耗时会非常大,如下: ; var r = new Random(); , arraySize).Select(x ...

  5. 四、并行编程 - 并行LINQ(PLINQ) 的使用。AsParallel

    用于对内存中的数据做并行运算,也就是说其只支持 LINQ to Object 的并行运算 一.AsParallel(并行化) 就是在集合后加个AsParallel(). 例如: , ); == ); ...

  6. .NET 实现并行的几种方式(三)

    本随笔续接:.NET 实现并行的几种方式(二) 在前两篇随笔中,先后介绍了 Thread .ThreadPool .IAsyncResult (即 APM系列) .Task .TPL (Task Pa ...

  7. .NET并行编程实践(一:.NET并行计算基本介绍、并行循环使用模式)

    阅读目录: 1.开篇介绍 2.NET并行计算基本介绍 3.并行循环使用模式 3.1并行For循环 3.2并行ForEach循环 3.3并行LINQ(PLINQ) 1]开篇介绍 最近这几天在捣鼓并行计算 ...

  8. c# Linq查询

    c#提供的ling查询极大的遍历了集合的查询过程,且使用简单方便,非常的有用. 下面将分别用简单的例子说明:ling基本查询.延迟查询属性.类型筛选.复合from字句.多级排序.分组查询.联合查询.合 ...

  9. 第十讲(LINQ)

    一..LINQ查询 例如: static void LINQQuery() { var query = from r in Formula1.GetChampions() where r.Countr ...

随机推荐

  1. Android复制WIN8点击下沉倾斜系统瓷砖效果

    ※效果 ※使用说明 Java代码 import android.app.Activity; import android.os.Bundle; import android.widget.Toast; ...

  2. 【Python】Python的urllib模、urllib2模块的网络下载文件

    因为需要从一些下载一个页PDF文件.但是需要下载PDF有数百个文件,这是不可能用人工点击下载.只是Python有相关模块,所以写一个程序PDF文件下载,顺便熟悉Python的urllib模块和ulrl ...

  3. Hadoop-1.1.2、HBase-0.94.7完全分布式集群结构

    爱的技术可以应用到实际生活生产,做艺术向往的东西不腻和音乐. 现将前期手里面的一个项目做一个大致的总结,与大家一起分享.交流.进步. 项目如今正在线上执行,项目名--基于Hadoop的数据分析综合管理 ...

  4. sql 子查询stuff功能(同一个人的多任务,多领域成为字符串)

    USE [erp2015] GO /****** Object: StoredProcedure [dbo].[GetUser] Script Date: 03/14/2015 13:27:04 ** ...

  5. oracle_job 清空冗余数据 ,每一分钟执行一次

    参照这个例子:http://cherryqq.iteye.com/blog/855022 思路: data表中有4条数据 ,relation有3条数据,通过data_id 对应,需要定时删除 data ...

  6. hdu 5073 Galaxy(2014acm鞍山亚洲分部 D)

    主题链接:http://acm.hdu.edu.cn/showproblem.php? pid=5073 Galaxy Time Limit: 2000/1000 MS (Java/Others)   ...

  7. 利用webBrowser获取框架内Html页面内容

    原文:利用webBrowser获取框架内Html页面内容 利用webBrowser获取页面比较简单,MSDN下有示例,在这里不必多说. 可是一些 HTML 文档由“框架”构成,或可以存放它们自己独特 ...

  8. Android checkCallingPermission()方法返回值问题

    Android开发检查权限时,发现调用checkCallingPermission()总是返回值-1,而Binder.getCallingPid() == Process.myPid()又总是返回tr ...

  9. ssh 自动登录

    工作中经常会有这样的需求场景,因为要在其它电脑上做操作, 需要从PC A ssh 到 PC B,PC A 可能是自己的工作机,PC B 可能是服务器.一般会使用 SSH 登录到 server 上再进行 ...

  10. A generic error occurred in GDI+. 上传图片报错

    代码就不说了,因为本地测试 ok, 服务端 就不行 ,服务器 环境 阿里云 win2008 r2  64 位 原因 是我没有这是 文件加权限 : 左边 的 少了 权限~ 代码 :含义是 网络图片 裁剪 ...