线程概念

在一个程序里的一个运行路线就叫做线程(thread)。更准确的定义是:线程是“一个进程内部的控制序列/指令序列”;

对于每一个进程至少有一个运行线程;

进程  VS. 线程 

1.进程是资源分配(进程须要參与资源的竞争)的基本单位,而线程是处理器调度(程序运行)的最小单位;

2.线程共享进程数据,但也拥有自己的一部分数据,如 线程ID、一组寄存器、堆栈、errno(错误代码)、信号状态、优先级等;

3.一个进程内部的线程能够共享资源,如代码段、数据段、打开文件和信号等(例如以下图所看到的)。

fork VS. pthread_create

当一个进程运行一个fork调用的时候,会创建出进程的一个新拷贝,新进程将拥有它自己的变量和它自己的PID。

这个新进程的运行时间是独立的,它在运行时差点儿全然独立于创建它的进程(其父进程).

而在进程里面创建一个新线程的时候,新的运行线程会拥有自己的堆栈(因此也就有自己的局部变量),但要与它的创建者共享全局变量、文件描写叙述符、信号处理器和当前的工作文件夹状态(例如以下图:最上面的三项code,data,files是共享的!);
(所以FTPserver是不能使用多线程实现的,由于一个线程引起的工作文件夹的改变,会影响到其它线程。)

线程的长处

创建一个新线程的代价要比创建一个新进程小得多(因此有时thread被称为轻型进程)

与进程之间的切换相比,线程之间的切换须要操作系统做的工作要少非常多(提高了并发程度)

线程占用的资源要比进程少非常多

能充分利用多处理器的可并行数量(假设是2CPU状态,多线程能够充分竞争到CPU,利用可并行)

在等待慢速I/O操作结束的同一时候,程序可运行其它的计算任务

计算密集型应用,为了能在多处理器系统上执行,将计算分解到多个线程中实现

I/O密集型应用,为了提高性能,将I/O操作重叠。线程能够同一时候等待不同的I/O操作

线程缺点

性能损失:一个非常少被外部事件堵塞的计算密集型线程往往无法与共它线程共享同一个处理器。

假设计算密集型线程的数量比可用的处理器多,那么可能会有较大的性能损失,这里的性能损失指的是添加了额外的同步和调度开销,而可用的资源不变。

健壮性减少:编写多线程须要更全面更深入的考虑。在一个多线程程序里,因时间分配上的细微偏差或者因共享了不该共享的变量而造成不良影响的可能性是非常大的,因此假设一个进程中的一个线程崩溃可能会造成其它线程的崩溃!换句话说线程之间是缺乏保护的。

缺乏訪问控制:进程是訪问控制的基本粒度,如在一个线程中调用某些OS函数会对整个进程造成影响,比方在一个线程中更改了当前工作文件夹,则其它线程也随之改变。

编程难度提高:编写与调试一个多线程程序比单线程程序困难得多;

线程调度竞争范围

操作系统提供了各种模型。用来调度应用程序创建的线程。这些模型之间的主要不同是,在竞争系统资源(特别是CPU时间)时,线程调度竞争范围(thread-scheduling contention scope)不一样:

1.进程竞争范围(process contention scope):各个线程在同一进程竞争“被调度的CPU时间”(但不直接和其它进程中的线程竞争)。

2.系统竞争范围(system contention scope):线程直接和“系统范围”内的其它线程竞争。

多线程模型

1. N:1[将多个用户级线程映射到一个内核级线程,早期OS的线程实现方式]

“线程实现”建立在“进程控制”机制之上。由用户空间的程序库来管理。OS内核全然不知道线程信息。这些线程称为用户空间线程。

这些线程工作在“进程竞争范围”;

长处:在N:1线程模型中。内核不干涉线程的不论什么生命活动。也不干涉同一进程中的线程环境切换。

线程管理实在用户空间进行的,因而效率比較高;

缺点:

(1)一个进程中的多个线程仅仅能调度到一个CPU。这样的约束限制了可用的并行总量。

(2)假设某个线程运行了一个“堵塞式”操作(如read),那么。进程中的全部线程都会堵塞,直至那个操作结束。为此,一些线程的实现是为这些堵塞式函数提供包装器,用非堵塞版本号替换这些系统调用,以消除这样的限制。

2. 1:1[将每一个用户级线程映射到一个内核级线程]

在1:1核心线程模型中。应用程序创建的每个线程都由一个核心线程直接管理。

OS内核将每个核心线程都调到系统CPU上,因此,全部线程都工作在“系统竞争范围”。

长处:当一个线程被堵塞后,同意还有一个线程继续执行,提高了并发的能力,然而这样的线程的创建与调度由内核完毕。因此这样的线程的系统开销比較大(但一般来说,比进程开销小)

3. N:M[将N个用户级线程映射到M个内核级线程上,要求N>=M,当代的Posix线程(即当前Linux所採用的线程模型)]

N:M线程模型提供了两级控制,将用户线程映射为系统的可调度体以实现并行LWP,这个可调度体称为轻量级进程(LWP:lightweight process)。LWP再一一映射到核心线程.[thread -> LWP -> 核心线程(參与调度)]

轻量级进程是内核支持的用户线程,是内核线程的一种抽象对象。每一个线程拥有一个或多个轻量级线程,而每一个轻量级线程分别被绑定在一个内核线程上。

N:M线程模型克服了多对一模型的并发度不高的缺点,又克服了一对一模型的一个用户线程占用太多内核级线程,开销太大的缺点.又拥有多对一,一对一模型的各自的长处,可谓集两家之长;

线程实现分类:

(1)用户级线程

用户级线程主要解决的是上下文切换的问题,它的调度算法和调度过程所有由用户自行选择决定。在执行时不须要特定的内核支持。

在这里,操作系统往往会提供一个用户空间的线程库,该线程库提供了线程的创建、调度和撤销等功能,而内核仍然仅对进程进行管理。 假设一个进程中的某一个线程调用了一个堵塞的系统调用函数,那么该进程包含该进程中的其它所有线程也同一时候被堵塞。

这样的用户级线程的主要缺点是在一个进程中的多个线程的调度中无法发挥多处理器的优势。

(2)内核级线程

这样的线程同意不同进程中的线程依照同一相对优先调度方法进行调度,这样就能够发挥多处理器的并发优势。

如今大多数系统都採用用户级线程与核心级线程并存的方法。一个用户级线程能够相应一个或几个核心级线程,也就是“一对一”或“多对一”模型。这样既可满足多处理机系统的须要。也能够最大限度地降低调度开销。

总结:

使用线程机制大大加快上下文切换速度并且节省非常多资源。可是由于在用户态和内核态均要实现调度管理,所以会添加实现的复杂度和引起优先级翻转的可能性。

一个多线程程序的同步设计与调试也会添加程序实现的难度.

Linux多线程实践(一)线程基本概念和理论的更多相关文章

  1. Linux多线程实践(1) --线程理论

    线程概念 在一个程序里的一个执行路线就叫做线程(thread).更准确的定义是:线程是"一个进程内部的控制序列/指令序列"; 一切进程至少有一个执行线程; 进程  VS. 线程  ...

  2. Linux多线程实践(2) --线程基本API

    POSIX线程库 与线程有关的函数构成了一个完整的系列,绝大多数函数的名字都是以"pthread_"开头,要使用这些函数库,要通过引入头文<pthread.h>,而且链 ...

  3. Linux多线程实践(4) --线程特定数据

    线程特定数据 int pthread_key_create(pthread_key_t *key, void (*destr_function) (void *)); int pthread_key_ ...

  4. Linux多线程实践(3) --线程属性

    初始化/销毁线程属性 int pthread_attr_init(pthread_attr_t *attr); int pthread_attr_destroy(pthread_attr_t *att ...

  5. Java高并发和多线程系列 - 1. 线程基本概念

    1. 什么是线程? 线程和进程的区别 在了解线程的概念前,我们应该先知道什么是进程? 进程是操作系统的基本概念之一, 它是正在执行的程序实例. * 下面的一些进程的基本概念你可以了解下 ------- ...

  6. Linux多线程实践(9) --简单线程池的设计与实现

    线程池的技术背景 在面向对象编程中,创建和销毁对象是很费时间的,因为创建一个对象要获取内存资源或者其它更多资源.在Java中更是如此,虚拟机将试图跟踪每一个对象,以便能够在对象销毁后进行垃圾回收.所以 ...

  7. Linux多线程实践(四 )线程的特定数据

    在单线程程序中.我们常常要用到"全局变量"以实现多个函数间共享数据, 然而在多线程环境下.因为数据空间是共享的.因此全局变量也为全部线程所共同拥有.但有时应用程序设计中有必要提供线 ...

  8. Linux多线程实践(三)线程的基本属性设置API

    POSIX 线程库定义了线程属性对象 pthread_attr_t ,它封装了线程的创建者能够訪问和改动的线程属性.主要包含例如以下属性: 1. 作用域(scope) 2. 栈尺寸(stack siz ...

  9. Linux多线程实践(10) --使用 C++11 编写 Linux 多线程程序

    在这个多核时代,如何充分利用每个 CPU 内核是一个绕不开的话题,从需要为成千上万的用户同时提供服务的服务端应用程序,到需要同时打开十几个页面,每个页面都有几十上百个链接的 web 浏览器应用程序,从 ...

随机推荐

  1. grpc vs2015编译

    获取gRPC源码 gRPC是开源框架,项目代码在github上,所以首先要安装github.github安装后,在指定文件夹中,执行git命令就可以获取gRPC的所有源码. git clone  ht ...

  2. 用虚拟机创建win7 32位系统来测试win 7 64位系统无法安装cad 2004 缺少acdb16.dll的问题

  3. Reorder List 最典型的linkedlist题目

    https://oj.leetcode.com/problems/reorder-list/ Given a singly linked list L: L0→L1→…→Ln-1→Ln,reorder ...

  4. [转载]linux上安装oracle

    原文地址:linux上安装oracle作者:天涯恨客 1.创建oinstall组 [root@xieqing ~]# groupadd oinstall 创建dba组 [root@xieqing ~] ...

  5. Android 解决toolbar标题不显示问题

    问题原因:toolbar的兼容性有问题 解决办法: setSupportActionBar(toolbar); toolbar使用步骤: 1.编写menu.xml 为了保持兼容需要这样写: andro ...

  6. 13.javaweb xml标签库详解

    一.XML标签简介 1,  作用 2,  标签分类 XPath 路径标记 查找节点元素示例 2.1<x:out> 2.2<x:parse> 操作示例:导入XML文件,解析,然后 ...

  7. C# 学习笔记_类

    定义:将成员及方法封装到类中,类的实例则称为对象. 结构:属性,类修饰符,class,类名,{类体} 类修饰符:new,public,protected,internal,private,abstra ...

  8. Oracle"TNS监听程序找不到符合协议堆栈要求的可用处理程序"解决方案

    问题描述:在使用ETL工具通过odbc方式连接Oracle进行数据抽取的过程中,Oracle 监听日志报错如下: 根本原因就是Oracle的process和session已经达到了甚至超过了最大值,解 ...

  9. ERROR 1840 (HY000) at line 24: @@GLOBAL.GTID_PURGED can only be set when @@GLOBA

    在MySQL 5.7版本中,备份迁移数据库的时候,还原时提示如下报错信息 ERROR 1840 (HY000) at line 24: @@GLOBAL.GTID_PURGED can only be ...

  10. ES: 机器学习、专家系统、控制系统的数学映射

    一.基本定义    1.机器学习维基定义:机器学习有下面几种定义: "机器学习是一门人工智能的科学,该领域的主要研究对象是人工智能,特别是如何在经验学习中改善具体算法的性能". & ...