性能的思考

提升性能意味着可以用更少的资源做更多的事情。但是提升性能会带来额外的复杂度,这会增加线程的安全性和活跃性上的风险。

我们渴望提升性能,但是还是要以安全为首要的。首先要保证程序能够安全正常的运行,然后在需要的时候进行性能优化,并且优化后的程序要尽可能保持并发性,让多处理中每个cpu尽可能得不要空闲,但是如果程序的并发没有设计好,那么可能会出现并发程序没有利用好现代多处理器的优势而导致并发化后的性能还不如串行化性能。

相较于单线程,多线程有很多独有的性能开销因素:

(1)线程之间的协调(如,加锁、内存同步等)

(2)增加的上下文切换

(3)线程的创建和销毁

(4)线程调度

可伸缩性:当增加计算机资源时(资源指:CPU、内存、硬盘),程序的吞吐量会得到提升。

Amdahl定律

在增加计算资源的情况下,程序在理论上能够实现最高的加速比,这个值取决于程序中可并行组件与串行组件所占的比重。

假定F是必须被串行执行的部分,那么根据Amdahl定律,在包含N个处理器的机器中,最高的加速比为:

Speedup<=1/(F+(1−F)/n)

当N趋近于无穷大时,最大的加速比趋近于1/F。因此有50%的计算需要串行执行,那么最高的加速比只能是2。

利用率:加速比除以处理器的数量。

随着处理器数量的增加,可以很明显地看到,即使串行部分所占的百分比很小,也会极大地限制当增加计算资源时能够提升的吞吐率。

在所有的并发程序中都包含一些串行部分(比如工作线程从队列拿取任务的时候,就需要加锁(串行化))。

Amdahl定律告诉我们:在串行化程序占比固定下,加速器越多,加速比也会越高,程序的可伸缩性和处理能力也就越好,但是也需要适可而止,因为当任务数比较少,但是处理器又很多,此时处理器的利用率也会降低(当然如果你有钱,觉得处理器想买多少就买多少当我没说)。

在各个框架中隐含的串行部分

上面说到,不管什么样的并发程序中,都必定有串行部分,那么以任务队列为例,比如工作线程从队列拿取任务的时候,就需要加锁(串行化)

图中对两种线程安全的Queue进行了比较,一个是同步容器SynchronizedLinkedList,一个是并发容器ConcurrentLinkedQueue,这俩有啥区别呢?图中显示,当线程数越多时,并发容器ConcurrentLinkedQueue的吞吐率的增幅相当快,而同步容器SynchronizedLinkedList几乎没有任何变化!why?

(1)同步容器的同步方式几乎都是在一个方法上加锁(锁住整个方法),锁住整个方法会带来的问题:

(a)独占锁会降低代码的可伸缩性:因为大量的线程都会因为锁而阻塞,那么程序的串行化占比会上升,所以根据Amdahl定律,加速比就会降低,可伸缩                    性降低。

(b)锁的请求频率:对一个锁请求的频率越高,就说明发生竞争的可能性越大,会限制可伸缩性(可以采取分段锁解决)。

(c)锁的请求时间:锁住整个方法比锁住某个代码块的持锁时间更长,锁持有时间过长会让程序串行化,限制可伸缩性。

(2)并发容器在安全处理上更为细粒度,因为采用的非阻塞式的算法:

(a)基于CAS(底层硬件提供并发机制)的并发程序,可伸缩性更好。

(b)摒弃了基于锁的机制,所以每个线程进来后都不用在锁上产生竞争而阻塞,并且不会产生线程的上下文的切换。

减少上下文切换的开销

任务在运行和阻塞这两个状态之间转换时,就相当于一次上下文切换。

多个线程同时记录日志:在输出流的锁上发生竞争。

I/O操作阻塞:操作系统将这个被阻塞的线程从调度队列中移走并直到I/O操作结束。

请求服务的时间不应该过长:服务时间越长,意味着越多的锁竞争。

通过将I/O操作从处理请求的线程中分离出来,可以缩短处理请求的平均服务时间。调用LOG方法的线程将不会再因为等待输出流的锁或者I.O完成而被阻塞,它们只需要要将消息放入队列,虽然在消息队列上可能会发生竞争,但put操作相对于记录日志的I/O操作(可能需要调用系统调用),是一种更为轻量级的操作,因此在实际上阻塞的概率更小,只要队列没填满。由于发出日志请求的线程被阻塞的概率降低,因此该线程在处理请求时被竞争的出去的概率也会降低。

通过将I/O操作移动了另一个用户感知不到开销的线程上,通过把所有记录日志的I/O转移到一个线程,还消除了输出流上的竞争,因此又去掉一个竞争来源。这将提升整体的吞吐量。

Amdahl定律和可伸缩性的更多相关文章

  1. Amdahl定律理解

    其中,a为并行计算部分所占比例,k为并行处理的个数. 当1-a=0时,(没有串行,只有并行)最大加速比s=n: 当a=0时,(只有串行,没有并行)最小加速比s=1: 当k→∞时,s → 1 /(1-a ...

  2. 《Java并发编程实战》第十一章 性能与可伸缩性 读书笔记

    造成开销的操作包含: 1. 线程之间的协调(比如:锁.触发信号以及内存同步等) 2. 添加�的上下文切换 3. 线程的创建和销毁 4. 线程的调度 一.对性能的思考 1 性能与可伸缩性 执行速度涉及下 ...

  3. java并发编程实战:第十一章----性能和可伸缩性

    线程的最主要目的是提高程序的运行性能,但性能的提升会导致复杂性的提升,又会导致安全性和活跃性的风险 一.对性能的思考 提升性能意味着用更少的资源做更多地事情.要想通过并发来获得更好的性能,就要更有效地 ...

  4. java并发编程(4)性能与可伸缩性

    性能与可伸缩性 一.Amdahl定律 1.问题和资源的关系 在某些问题中,资源越多解决速度越快:而有些问题则相反: 注意:每个程序中必然有串行的部分,而合理的分析出串行和并行的部分对程序的影响极大:串 ...

  5. 《java并发编程实战》读书笔记8--死锁,性能与可伸缩性,锁粒度锁分解锁分段

    第10章 避免活跃性危险 10.1 死锁 -10.1.1 锁顺序死锁 最简单的一种死锁形式: -10.1.2 动态的锁顺序死锁 可以通过下面的方法来解决: -10.1.3 在协作对象之间发生死锁 -1 ...

  6. Java并发编程实战 第11章 性能与可伸缩性

    关于性能 性能的衡量标准有很多,如: 服务时间,等待时间用来衡量程序的"运行速度""多快". 吞吐量,生产量用于衡量程序的"处理能力",能够 ...

  7. 深入浅出 Java Concurrency (40): 并发总结 part 4 性能与伸缩性[转]

    性能与伸缩性 使用线程的一种说法是为了提高性能.多线程可以使程序充分利用闲置的资源,提高资源的利用率,同时能够并行处理任务,提高系统的响应性. 但是很显然,引入线程的同时也引入了系统的复杂性.另外系统 ...

  8. java高并发系列 - 第3天:有关并行的两个重要定律

    有关为什么要使用并行程序的问题前面已经进行了简单的探讨.总的来说,最重要的应该是处于两个目的. 第一,为了获得更好的性能: 第二,由于业务模型的需要,确实需要多个执行实体. 在这里,我将更加关注第一种 ...

  9. C# - 多线程 之 进程与线程

    并行~并发 并发 Concurrency,逻辑上的同时发生,一个处理器(在不同时刻或者说在同一时间间隔内)"同时"处理多个任务.宏观上是并发的,微观上是按排队等待.唤醒.执行的步骤 ...

随机推荐

  1. git diff 的简单使用(比较版本区别)

    假如我们修改viewMail.vue 文件(部分代码) 从 //根据ID获取详情 getById () { let that = this; this.viewMailModal = true; th ...

  2. 【php设计模式】模板模式

    定义一个操作中算法的骨架,而将一些步骤延迟到子类中,模板方法使得子类可以不改变算法的结构即可重定义该算法的某些特定步骤. 通俗点的理解就是 :完成一件事情,有固定的数个步骤,但是每个步骤根据对象的不同 ...

  3. script标签所应放的位置

    一般放置的位置:<head>标签内,<body>标签内,<body>标签后(建议放在body标签后,利于页面的优化,优化页面结构加载的速度) 1.<head& ...

  4. HTML中由于DIV(块元素)浮动,导致的父元素高度塌陷问题的解决方案

    费话不多说,直接上问题: 1.开始时,页面只有两个DIV的嵌套(见图) 运行结果是: 现在看运行的是正常的,但是当我设置让 class="box2" 的DIV浮动时 运行结果是这样 ...

  5. 转载:PHP扩展函数库-文件系统、进程与网络

    PHP的扩展函数库十分庞大,官方的非官方的,在这里只记录一些目前比较常用的扩展,对于这一部分,也只是记录其中一些核心的函数,不是一个全面记录.对于详细的扩展函数说明,需要在使用中参考PHP的用户手册. ...

  6. github 提交和更新代码

    …or create a new repository on the command line   echo "# flutterPluginsWorks" >> RE ...

  7. 【Day4】3.urllib模块使用案例

    import urllib.request as ur ret = ur.urlopen('https://edu.csdn.net/').read() with open('edu.html','w ...

  8. 【Day3】2.re模块使用案例

    课程目标 1.提取 2.匹配 3.替换 1.提取 import re ret = re.findall([正则表达式]) # 返回的类型是列表 2.匹配 import re ret = re.matc ...

  9. 从0到1写rtos:事件的挂起

    任务的状态: 未创建:只定义了任务代码,未调用tTaskInit()初始化 就绪:任务已经创建完毕,且等待机会占用CPU运行 运行:任务正在占用CPU运行代码 延时:任务调用tTaskDelay()延 ...

  10. linux常用的操作命令

    ---恢复内容开始--- 最近换了工作之后,需要管理linux服务器的日常运行和维护,自然linux命令是少不了的,切换目录,vim操作等的简单的操作就不说了,有些时候还需要查看日志和监控服务器启动进 ...