前面看完了Task对象,这里再看一下另一个息息相关的对象Parallel。

Parallel对象

  Parallel对象封装了能够利用多核并行执行的多线程操作,其内部使用Task来分装多线程的任务并试图将它们分配到不同的内核中并行执行。请注意“试图”这个词,Parallel对象相当具有智能性,当它判断任务集并没有从并行运行中受益,就会选择按顺序运行。这样的做法是因为并非所有的项目都适合使用并行开发,创建过多并行任务可能会损害程序的性能,降低运行效率。

  Parallel对象是静态类,它主要有3个静态方法:Invoke,For,ForEach。针对这3个方法,该对象也提供了多种不同的重载方法,使用起来相当的简单。先看一个简单的例子:

static void Main(string[] args)
{
Parallel.Invoke(
()=>Console.WriteLine("1st task!"),
()=>Console.WriteLine("2nd task!"));
}

  这个例子中的两个任务就是并行执行的,所以结果可能是第一个先完成,也可能是第二个先输出结果。是不是超级简单?有没有使用一下Parallel对象的冲动?

  下面这个网上的例子验证了一下运行时间上并行计算的优越性:

private const int count = ;
private static void M1()
{
Console.WriteLine("M1 is busy now");
for (int i = ; i < count; i++)
;
Console.WriteLine("M1 is Done");
}
private static void M2()
{
Console.WriteLine("M2 is busy now");
for (int i = ; i < count; i++)
;
Console.WriteLine("M2 is Done");
}
static void Main(string[] args)
{
// 顺序执行
DateTime start1 = DateTime.Now;
M1();
M2();
Console.WriteLine(DateTime.Now - start1); // 并行执行
DateTime start2 = DateTime.Now;
Parallel.Invoke(M1, M2);
Console.WriteLine(DateTime.Now - start2);
}

  在不同的机器上,得到的结果可能不同,但是基本上所有的多核机器上得到的结果一定是并行执行的时候耗时比较短,例子比较简单,但是道理确实很直接。

  通常来说,对于一个程序,性能提升的关键是将可以并行执行的同步程序改成并行执行。这个上面的例子也反应了修改后的效果。此外,对于程序来说,循环是影响复杂度的最直接的因素,这个我们看看教科书上计算算法时间复杂度的算法就知道了,所以提升循环的执行效率往往是提升程序效率的关键一步。Parallel对象充分考虑到了这一点,提供了循环的并行版本。

例子一:For循环。

static void Main(string[] args)
{
for (int i = ; i < ; i++) Console.Write("{0} ", i);
Console.WriteLine("by serial");
Parallel.For(, , (n) => Console.Write("{0} ", n));
Console.WriteLine("by parallel");
}

  从输出的结果你可以很容易发现后面的结果顺序完全是不固定的,这是并行的特征。

例子二:ForEach循环

static void Main(string[] args)
{
int [] a = {,,,,,,,,};
foreach (var n in a) Console.Write("{0} ",n);
Console.WriteLine("by serial");
Parallel.ForEach(a, (n) => Console.Write("{0} ", n));
Console.WriteLine("by parallel");
}

  结果也很明显,就不多说了。

  通过上面的两个例子,其实我们就能发现一些问题:

1. 顺序要求严格的操作不能使用Parallel对象的方法,这个原因很简单。

2. 并不是所有的for语句都可以用并行处理来实行,只有在循环开始前循环的次数已确定的情况下可以采用并行处理。同理,do语句和while语句也不能采用并行处理。因为所谓“并行”就是在判定为“循环结束”之前,首先要把将要执行的循环实现分配好。

  好了,既然是对循环的并行处理,那就避不开break与continue的问题,也就是循环的主动中止问题。

循环的主动中止

  在Parallel对象中,也可以主动中止循环的执行:调用ParallelLoopState实例的Stop方法和Break方法,可以停止和中断当前循环的执行。其中,

1. Break 告知 Parallel 循环应在系统方便的时候尽早停止执行当前迭代之外的迭代,当前迭代之前的迭代任然会完成。
2. Stop 告知 Parallel 循环应在系统方便的时候尽早停止执行,不管其他的线程执行到什么程度。
  通常使用Stop会立即停止循环,使用Break却会执行完毕当前迭代次序前面的迭代后停止循环。例如,对于从 0 到 1000 并行迭代的 for 循环,如果从第 100 此迭代开始调用 Break,则低于 100 的所有迭代仍会运行,从 101 到 1000 的迭代则不一定会执行,注意是“不一定”,因为是并行执行的,说不定某些次序在后面的迭代已经执行了。看一下例子:

static void Main(string[] args)
{
DemoStop();
DemoBreak();
} /// <summary>
/// 中断Stop
/// </summary>
static void DemoStop()
{
List<int> data = new List<int>(){ , , , , , , , , , };
Parallel.For(, data.Count, (i, LoopState) =>
{
if (i > )
LoopState.Stop();
Thread.Sleep();
Console.WriteLine(i);
});
Console.WriteLine("Stop执行结束。");
}
/// <summary>
/// 中断Break
/// </summary>
static void DemoBreak()
{
List<int> data = new List<int>() { , , , , , , , , , };
Parallel.ForEach(data, (i, LoopState) =>
{
if (i > )
LoopState.Break();
Thread.Sleep();
Console.WriteLine(i);
});
Console.WriteLine("Break执行结束。");
}

  运行一下,对比结果,细细体会一下输出的结果,我想你就会清楚Stop方法与Break方法的区别。

  当然了,前面讲的使用CancellationTokenSource取消线程的方式这里任然是适用的,不过需要通过ParallelOptions传给Parallel对象对应的重载方法。ParallelOptions对象还可以配置其他的一些参数,比如最大的并行数量(其实就是使用的最大内核数量)等等。看一个简单的例子:

CancellationTokenSource token = new CancellationTokenSource();
Task.Factory.StartNew(() =>
{
Thread.Sleep();
token.Cancel();
Console.WriteLine("Token Cancelled.");
}); ParallelOptions loopOptions = new ParallelOptions()
{
CancellationToken = token.Token,
MaxDegreeOfParallelism =
}; try
{
Parallel.For(, Int64.MaxValue, loopOptions, i =>
{
Console.WriteLine("i={0},thread id={1}", i, Thread.CurrentThread.ManagedThreadId);
Thread.Sleep();
});
}
catch (OperationCanceledException)
{
Console.WriteLine("Exception...");
}

  讨论完了各种正常情况,下面来看一下不正常的情况:异常问题。

异常问题

  和普通的for/foreach中发生异常的表现一样,Parallel循环中的任何异常都会使整个循环终止,不过由于整个循环是分核同时进行的,因此整个循环不会立即终止,这个很好理解。循环中停止前所有的异常都会被封装在AggregateException的InnerExceptions中。捕获这些异常的方式很简单,使用try/catch就可以了,看一下下面的代码:

try
{
Parallel.For(, , (i) =>
{
throw new Exception(i.ToString());
});
}
catch (AggregateException ae)
{
foreach (var exp in ae.InnerExceptions)
{
Console.WriteLine(exp.Message);
}
}

  这段代码将会输出0-4的子集(也有可能是0-4全部输出,因为5个线程都很快)。

  不过,与Parallel.For和ForEach不一样的是,Parallel.Invoke总是会把所有任务都执行完,然后把所有的异常包装在AggregateException中。其实道理与上面的循环是一样的,都是把应该执行的任务执行完,来看这段代码:

try
{
Parallel.Invoke(() => { throw new Exception(""); },
() => { Thread.Sleep(); throw new Exception(""); },
() => { Thread.Sleep(); throw new Exception(""); });
}
catch (AggregateException ae)
{
foreach (var ex in ae.InnerExceptions)
{
Console.WriteLine(ex.Message);
}
}

  结果会输出:3 2 1。

  除此以外,Task.WaitAll和Parallel.Invoke是类似,任何一个(或多个)Task的异常不会影响任何其他Task的执行。

try
{
var t1 = Task.Factory.StartNew(() =>
{
Thread.Sleep();
throw new Exception("");
}); var t2 = Task.Factory.StartNew(() =>
{
Thread.Sleep();
throw new Exception("");
}); Task.WaitAll(t1, t2);
}
catch (AggregateException ae)
{
foreach (var exp in ae.InnerExceptions)
{
Console.WriteLine(exp.Message);
}
}

  这段代码会输出:1 2。

  两个异常都会在AggregateException中的InnerExceptions属性中。不过很显然异常的顺序与上一个例子有点不同,这个需要注意一点。

  其实,在新的.NET类库中,不仅通过增加Parallel对象来增强并行处理的能力,而且在Linq语句中也有相应的增强,那就是PLinq。

PLinq简介

  PLINQ也就是Parallel Linq,它的使用方法是非常简单。
  下例本身没有什么太大意义,只不过是找出“2”,然后输出:

using System;
using System.Linq;
using System.Threading.Tasks;
class Program
{
static void Main(string[] args)
{
int[] ar = { , , };
var q1 = from n in ar
where n ==
select n;
foreach (var n in q1)
{
Console.WriteLine("found {0}", n);
}
}
}

如果把上例改成用并行处理,只要在查询表达式中追加AsParallel方法就可以了:

var q1 = from n in ar.AsParallel()
where n ==
select n;

函数形式也是一样的。例如下面这个查询表达式:

var q1 = ar.Where((c) => c == );

改成并行执行也就是插入AsParallel方法就可以了:

var q1 = ar.AsParallel().Where((c) => c == );

  使用PLINQ是如此的简单,只要用一个方法就可以用并行来处理查询表达式了。但是,正如前面所讲的并行计算并不是适用于任何场合的灵丹妙药,它也有不太适用的场合:
1. 在大量使用查询表达式的时候,并不是每一句查询表达式都是性能瓶颈的关键,如果每一个查询表达式都插入AsParallel方法,不会带来太大好处,在浪费时间的同时,代码的可读性也降低了。
2. 插入AsParallel方法后,结果会发生变化,这个自然很好理解,因为并行执行了嘛,顺序得不到保证,所以与顺序有关的操作是适合使用同步操作的,并行执行就可能导致问题。

  其实AsParallel方法只是PLinq的基本入口点,在System.Linq.ParallelEnumerable类中,包含了并行查询的大部分其他有用的方法,比如:AsSequential(指定查询的其余部分应像非并行 LINQ 查询一样按顺序运行),AsOrdered(指定 PLINQ 应保留查询的其余部分的源序列排序,直到例如通过使用 orderby子句更改排序为止),AsUnordered(指定查询的其余部分的 PLINQ 不需要保留源序列的排序)等等方法。这个查看一下MSDN就可以了,使用起来还是比较方便的。也可查看博客园中的一些详细的文章,比如:http://www.cnblogs.com/leslies2/archive/2012/02/07/2320914.html

  并行计算就简单总结这些了,铭记一点:并行执行的任务要保证是顺序无关的,独立的。

C#的变迁史 - C# 4.0 之并行处理篇的更多相关文章

  1. C#的变迁史 - C# 4.0 之多线程篇

    在.NET 4.0中,并行计算与多线程得到了一定程度的加强,这主要体现在并行对象Parallel,多线程Task,与PLinq.这里对这些相关的特性一起总结一下. 使用Thread方式的线程无疑是比较 ...

  2. C#的变迁史 - C# 4.0 之线程安全集合篇

    作为多线程和并行计算不得不考虑的问题就是临界资源的访问问题,解决临界资源的访问通常是加锁或者是使用信号量,这个大家应该很熟悉了. 而集合作为一种重要的临界资源,通用性更广,为了让大家更安全的使用它们, ...

  3. C#的变迁史 - C# 5.0 之调用信息增强篇

    Caller Information CallerInformation是一个简单的新特性,包括三个新引入的Attribute,使用它们可以用来获取方法调用者的信息, 这三个Attribute在Sys ...

  4. C#的变迁史 - C# 5.0 之并行编程总结篇

    C# 5.0 搭载于.NET 4.5和VS2012之上. 同步操作既简单又方便,我们平时都用它.但是对于某些情况,使用同步代码会严重影响程序的可响应性,通常来说就是影响程序性能.这些情况下,我们通常是 ...

  5. C#的变迁史 - C# 4.0篇

    C# 4.0 (.NET 4.0, VS2010) 第四代C#借鉴了动态语言的特性,搞出了动态语言运行时,真的是全面向“高大上”靠齐啊. 1. DLR动态语言运行时 C#作为静态语言,它需要编译以后运 ...

  6. C#的变迁史 - C# 3.0篇

    C# 3.0 (.NET 3.5, VS2008) 第三代C#在语法元素基本完备的基础上提供了全新的开发工具和集合数据查询方式,极大的方便了开发. 1. WPF,WCF,WF 这3个工程类型奠定了新一 ...

  7. C#的变迁史 - C# 2.0篇

    在此重申一下,本文仅代表个人观点,如有不妥之处,还请自己辨别. 第一代的值类型装箱与拆箱的效率极其低下,特别是在集合中的表现,所以第二代C#重点解决了装箱的问题,加入了泛型.1. 泛型 - 珍惜生命, ...

  8. C#的变迁史 - C# 5.0 之其他增强篇

    1. 内置zip压缩与解压 Zip是最为常用的文件压缩格式之一,也被几乎所有操作系统支持.在之前,使用程序去进行zip压缩和解压要靠第三方组件去支持,这一点在.NET4.5中已有所改观,Zip压缩和解 ...

  9. C#的变迁史 - C# 1.0篇

    C#与.NET平台诞生已有10数年了,在每次重大的版本升级中,微软都为这门年轻的语言添加了许多实用的特性,下面我们就来看看每个版本都有些什么.老实说,分清这些并没什么太大的实际意义,但是很多老资格的. ...

随机推荐

  1. 学习Scala01 环境安装

    Scala是一门运行在jvm上的多范式语言,作为一个java程序员,使用Scala来写写程序,既不用担心会没有java强大的库支持,又能快速地写出简短强悍的代码,除此之外scala还为我们提供了强大的 ...

  2. NSString NSNumber 相互转化

    NSNumberFormatter *numFormatter = [[NSNumberFormatter alloc] init]; NSNumber *firstNum = [NSNumber n ...

  3. [Java面试九]脚本语言知识总结.

    核心内容概述 1.JavaScript加强,涉及到ECMAScript语法.BOM对象.DOM对象以及事件. 2.Ajax传统编程. 3.jQuery框架,九种选择器为核心学习内容 4.JQuery ...

  4. salesforce 零基础学习(十七)Trigger用法

    看本篇之前可以相应阅读以下Trigger相关文章: 1.https://developer.salesforce.com/page/Trigger_Frameworks_and_Apex_Trigge ...

  5. 如何优雅的使用vue+vux开发app -02

    如何优雅的使用vue+vux开发app -02 很明显这又是一个错误的示范,请勿模仿 使用动态组件实现保留状态的路由 <!DOCTYPE html> <html> <he ...

  6. IIS集成模式下,URL重写后获取不到Session值

    近期给公司网站添加了伪静态功能,但是今天发现了在伪静态的页面中,Session值是获取不到的. 原因是在伪静态请求的时候,Session请求被“过滤”掉了. 开始是把web.config文件中的mod ...

  7. 谈谈java的运行机制

    1.高级语言的运行机制 我们编程都是用的高级语言(写汇编和机器语言的大牛们除外),计算机不能直接理解高级语言,只能理解和运行机器语言,所以必须要把高级语言翻译成机器语言,计算机才能运行高级语言所编写的 ...

  8. stackView的隐藏与显示注意事项

    1.想要通过变换stackView的y值来让stackView显现/隐藏,同时让其中的button能点击响应,得用topCons 2.导航栏的tinBar要设置为非透明状态

  9. javase基础复习攻略《九》

    本篇将为大家总结JAVA中的线程机制,谈到线程,大家一定会问线程和进程有什么区别?刚接触进程时我也有这样的疑问,今天就为大家简单介绍一下进程和线程.进程(Process)是计算机中的程序关于某数据集合 ...

  10. s2sh框架搭建(辅助工具:MyEclipse)及解决一些遇到的问题

    1.新建一个web project 2.首先生成Hibernate Facet 3.Hibernate Facet 安装步骤 4.然后是spring facet安装步骤 5.最后是struts fac ...