Task的运行原理和工作窃取（work stealing）

在net4.0以前，当调用ThreadPool.QueueUserWorkItem方法往线程池中插入作业时，会把作业内容（其实就是一个委托）放到线程池中的一个全局队列中，然后线程池中的线程按照先进先出的方式取出作业，并处理。

如下图中的方式，主程序创建了Item到Queue中，然后分配到了各个工作线程中。

但
是在.net 4.0以后，线程池做了一些改进，比如增加了TPL（Task Parallel Library），TPL使用到了.net
4.0中新增加的一些特性。这些特性只能通过TPL运用，不能直接通过ThreadPool类运用
。TPL中的Task并不是线程，Task的执行是需要依靠线程池中的线程来完成的。

创建和启动一个Task类似调用
ThreadPool.QueueUserWorkItem，但不同的是线程池中的每一个线程都有一个本地队列。线程池通过一个任务调度器来分配任务，当
主程序创建了一个Task后，由于创建这个Task的线程不是线程池中的线程，则任务调度器会把该Task放入全局队列中。

如果这个Task是由线程池中的线程创建，并且未设置TaskCreationOptions.PreferFairness标记（默认情况下未设置），则任务调度器会把该Task放入到该线程的本地队列中。如果设置了TaskCreationOptions.PreferFairness标记，则放入全局队列。

如下面的演示图，Task1和Task2都是主程序创建的，因此都是放在全局队列中，当工作者线程处理Task2时，创建了一个Task3，此时Task3被放入本地队列

为什么要设计本地队列？这样做的优势是充分利用并行。随着越来越多线程竞争工作项，所有的线程访问单一的队列并不是最优的，并且也不安全。所以，将任务放入本地队列，并且由同一个线程处理，这就避免了竞争。
本地队列中的Task，线程会按照LIFO的方式去处理。这是因为在大多数场景下，最后创建的Task可能仍然在cache中，处理它能够提供缓存命中率。显然这意味放弃部分公平性而保证性能。如下面的演示图，

工作者线程1创建了Task2，Task2创建了Task3，Task4，Task5，但最先处理的还是Task5。

线程窃取work stealing
当
A线程开始执行的时候，优先总是处理本地队列中的任务，当它发现本地队列已经空了，那么它会去全局队列中获取Task，当全局队列中也是空的，那么就会发
生工作窃取（work
stealing）。任务调度器会把该线程池中额外的任务分配给A线程处理，其效果就好比该线程会才从其他线程的队列中“窃取”一个Task来执行。这样
的目的是提高了cpu的使用效率。

这种策略是任务调度器的默认策略，通常是不需要改变的。如果需要改变，需要在创建任务时，设置任务的TaskCreationOptions.PreferFairness。

----------------------

参考资料

http://www.danielmoth.com/Blog/New-And-Improved-CLR-4-Thread-Pool-Engine.aspx

Task的运行原理和工作窃取（work stealing）的更多相关文章

Task的运行原理和工作窃取
在net4.0以前,当调用ThreadPool.QueueUserWorkItem方法往线程池中插入作业时,会把作业内容(其实就是一个委托)放到线程池中的一个全局队列中,然后线程池中的线程按照先进先出 ...
java线程池,工作窃取算法
前言在上一篇<java线程池,阿里为什么不允许使用Executors?>中我们谈及了线程池,同时又发现一个现象,当最大线程数还没有满的时候耗时的任务全部堆积给了单个线程, 代码如下: T ...
ASP.NET Core 运行原理剖析2:Startup 和 Middleware(中间件)
ASP.NET Core 运行原理剖析2:Startup 和 Middleware(中间件) Startup Class 1.Startup Constructor(构造函数) 2.Configure ...
【转载】Spark系列之运行原理和架构
参考 http://www.cnblogs.com/shishanyuan/p/4721326.html 1. Spark运行架构 1.1 术语定义 lApplication:Spark Applic ...
ASP.NET Core 运行原理解剖[1]:Hosting
ASP.NET Core 是新一代的 ASP.NET,第一次出现时代号为 ASP.NET vNext,后来命名为ASP.NET 5,随着它的完善与成熟,最终命名为 ASP.NET Core,表明它不是 ...
[Spark内核] 第40课：CacheManager彻底解密：CacheManager运行原理流程图和源码详解
本课主题 CacheManager 运行原理图 CacheManager 源码解析 CacheManager 运行原理图 [下图是CacheManager的运行原理图] 首先 RDD 是通过 iter ...
Spark核心技术原理透视一（Spark运行原理）
在大数据领域,只有深挖数据科学领域,走在学术前沿,才能在底层算法和模型方面走在前面,从而占据领先地位. Spark的这种学术基因,使得它从一开始就在大数据领域建立了一定优势.无论是性能,还是方案的统一 ...
SPARK：作业基本运行原理
Spark作业基本运行原理: 我们使用spark-submit提交一个spark作业之后,这个作业就会启动一个对应的Driver进程.根据你使用的部署模式(deploy-mode)不同:1)Drive ...
spark 任务运行原理
调优概述在开发完Spark作业之后,就该为作业配置合适的资源了.Spark的资源参数,基本都可以在spark-submit命令中作为参数设置.很多Spark初学者,通常不知道该设置哪些必要的参数,以 ...

随机推荐

Java反射机制的适用场景及其利与弊 ***
一.反射的适用场景是什么? 1).Java的反射机制在做基础框架的时候非常有用,有一句话这么说来着:反射机制是很多Java框架的基石.而一般应用层面很少用,不过这种东西,现在很多开源框架基本都已经给你 ...
Think in java.chm 第14章多线程
例子1引入线程概念通过得到当前线程方式循环主线程做某事例子2演示了在主线程之外开启多个线程的基本方式 ( new一个extends Thread ) 例子3 ( task extends Threa ...
bzoj2505: tickets
Description 有一位售票员给乘客售票,对于每位乘客,他会卖出多张连续的票,直到已卖出的编号的所有位置上的数的和不小于给定的正数k.然后他会按照相同的规则给下一位乘客售票.初 ...
《js笔记》
1.判断浏览器是否启用cookie: if (navigator.cookieEnabled==true) { alert("已启用 cookie") } else { alert ...
存在继承关系的Java类对象之间的类型转换(一)
类似于基本数据类型之间的强制类型转换. 存在继承关系的父类对象和子类对象之间也可以在一定条件之下相互转换. 这种转换需要遵守以下原则: 1.子类对象可以被视为是其父类的一个对象2.父类对象不能被 ...
redis相对关系型数据库的优势
它是键值数据库(非关系),数据查询比关系型数据库快. ps:redis是树状结构,查询快 redis是基于内存的一个数据库,I/O的效率影响较小. ps: 备份数据同步是才进行I/O操作.这个数据同步 ...
让别人能登陆你的mysql
线上的数据库肯定是不能轻易在开发新功能的时候动的,如果你的数据库跟线上不一样了又没有新数据库的备份,就很麻烦. 当然去动线上数据库,出了什么问题我是不想背锅的. 最稳健的办法!让管理线上数据库的同学, ...
POI 3.17
发现与之前使用的有些不同参考:https://www.cnblogs.com/h--d/p/6735110.html
什么是“堆”,"栈","堆栈","队列",它们的区别？
堆:什么是堆?又该怎么理解呢? ①堆通常是一个可以被看做一棵树的数组对象.堆总是满足下列性质: ·堆中某个节点的值总是不大于或不小于其父节点的值: ·堆总是一棵完全二叉树. 将根节点最大的堆叫做最大堆 ...
string类型版本号比较
直接上代码吧: boolean CompareVersion(string softVersion1, string softVersion2) { ) { return true; } return ...

Task的运行原理和工作窃取（work stealing）

Task的运行原理和工作窃取（work stealing）的更多相关文章

随机推荐

热门专题