Linux 进程,线程,线程池

在linux内核，线程与进程的区别很小，或者说内核并没有真正所谓单独的线程的概念，进程的创建函数是fork，而线程的创建是通过clone实现的。

而clone与fork都是调用do_fork(),差异如下:

 SYSCALL_DEFINE0(fork)

 {

     return do_fork(SIGCHLD, , , NULL, NULL);

 }

 SYSCALL_DEFINE5(clone, unsigned long, clone_flags, unsigned long, newsp,

          int __user *, parent_tidptr,

          int __user *, child_tidptr,

          int, tls_val)

 {

     return do_fork(clone_flags, newsp, , parent_tidptr, child_tidptr);

 }

实际上就是内核开放大部分参数和do_fork接口来创建线程,看clone的官方解释:

The main use of clone() is to implement threads: multiple threads of control in a program that run concurrently in a shared memory space.

所以接下来参考glibc 2.25版本的pthread_create来看看进程和线程的具体实现差异在哪里:

 const int clone_flags = (CLONE_VM | CLONE_FS | CLONE_FILES | CLONE_SYSVSEM

                | CLONE_SIGHAND | CLONE_THREAD

                | CLONE_SETTLS | CLONE_PARENT_SETTID

                | CLONE_CHILD_CLEARTID

                | );

显而易见clone_flags的差别非常大.

下面再来通过这些flags的作用来区分进程和线程的特性,细数之前先看看do_fork的实现,发现有意思的是,ptrace和perf这2个调试工具也是进程创建的时候初始化的.

1、CLONE_VM

首先线程不能脱离父进程独立存在,所以它需要共享父进程的虚拟内存空间

2、CLONE_FS | CLONE_FILES

线程做为父进程一个CPU执行单元,它可以直接使用父进程的文件系统信息(包括文件系统根目录,当前工作目录,和文件访问权限)而不需要自己独立创建和持有这些资源和父进程打开的文件描述符

3、CLONE_SIGHAND | CLONE_THREAD

线程还接着共享父进程的异步信号处理函数，即父进程能收到的异步信号，它也能收到并处理，不过线程可以自行通过sigprocmask来屏蔽或不屏蔽某些异步信号操作，而不影响其他线程。

4、CLONE_SYSVSEM

线程共享父进程的System V semaphore。

5、CLONE_SETTLS

线程支持TLS (Thread Local Storage)。TLS使得变量每一个线程有一份独立实体，各个线程的值互不干扰

6、CLONE_PARENT_SETTID

父进程和线程会将线程ID保存在内核任务结构体的ptid成员。

7、CLONE_CHILD_CLEARTID

清除内核任务结构体的ctid成员上存储的线程ID。

8、CLONE_THREAD

将线程放入到父进程的线程组（thread group）里，这样线程在用户态就看不到自己进程ID了，只能看到父进程的进程ID，并且线程共享父进程的异步信号。

子进程则会复制父进程的很多进程信息，复制与共享的区别还是很大的，复制需要重新申请内核资源，所以开销比线程大很多。

1、创建进程的时候没有指定 CLONE_VM | CLONE_FS | CLONE_FILES | CLONE_SIGHAND，所以这些它需要复制进程的，所以父进程这些信息也被子进程继承过去了，但是已经独立存在在子进程里了，以后就没有关系了。

2、子进程还复制父进程的信号处理函数和信号；

3、线程和子进程都会继承（复制）父进程的普通优先级，父进程的栈，CPU状态会被设置为RUNNING。

总结一下：

1、进程，线程的创建还有很多细节，我这里没有完全列举出来，只列举了我觉得比较重要的部分。

2、线程，进程的最大区别就是，啃老还是不啃老，通过上面来看，线程就是个啃老的货，而进程是个依靠父母独立成长的好孩子，然并卵，事实证明，不管是现实世界还是计算机这个虚拟世界，越独立就越占用资源！

4、所以，多用线程可以降低系统资源的消耗。

上面讲到要多用线程，下面就轮到线程池要出场了，但是这个世界总是有很多熊孩子，就喜欢不停给他老子搞事情，严重到。。。咳咳，我们还是严肃的描述吧：

严重到不停的创建线程，销毁线程，这就增加了内核的开销了，更有甚之，有的线程函数无比简短，可能线程刚创建完就要销毁了。。。

所以避免出现这样的情况，很多场合需要用到进程池。

关于pthread可以参考如下文章：

http://www.ibm.com/developerworks/cn/linux/thread/posix_threadapi/part1/

https://www.ibm.com/developerworks/cn/linux/thread/posix_threadapi/part2/

https://www.ibm.com/developerworks/cn/linux/thread/posix_threadapi/part3/

https://www.ibm.com/developerworks/cn/linux/thread/posix_threadapi/part4/

https://www.ibm.com/developerworks/cn/linux/thread/posix_threadapi/part5/

Linux 进程,线程,线程池的更多相关文章

Linux进程或线程绑定到CPU
Linux进程或线程绑定到CPU 为了让程序拥有更好的性能,有时候需要将进程或线程绑定到特定的CPU,这样可以减少调度的开销和保护关键进程或线程. 进程绑定到CPU Linux提供一个接口,可以将进程 ...
Linux进程和线程的比較
进程与线程參考:http://www.cnblogs.com/blueclue/archive/2010/07/16/1778855.html 首先比較Linux进程和线程的创建的差别,以此展开: ...
Linux 进程、线程运行在指定CPU核上
/******************************************************************************** * Linux 进程.线程运行在指定 ...
Linux进程与线程的区别
进程与线程的区别,早已经成为了经典问题.自线程概念诞生起,关于这个问题的讨论就没有停止过.无论是初级程序员,还是资深专家,都应该考虑过这个问题,只是层次角度不同罢了.一般程序员而言,搞清楚二者的概念, ...
linux进程、线程与cpu的亲和性（affinity）
参考:http://www.cnblogs.com/wenqiang/p/6049978.html 最近的工作中对性能的要求比较高,下面简单做一下总结: 一.什么是cpu亲和性(affinity) C ...
linux进程与线程的区别【转】
知乎上总结: "linux使用的1:1的线程模型,在内核中是不区分线程和进程的,都是可运行的任务而已.fork调用clone(最少的共享),pthread_create也是调用clone(最 ...
Linux进程和线程
一.进程产生的方式 1.描述进程的ID号通常叫做PID,即进程ID,PID的变量类型为pid_t. 2.getpid(void)返回当前进程的ID号,getppid(void)返回当前进程的父进程的I ...
Linux -- 进程或线程独占CPU
如果想让特定进程或线程独占某一或某些CPU,我们需要做三件事. 一,隔离CPU,避免其它线程run在被隔离的CPU上. 二,绑定所有的interrupts到非隔离的CPU上,避免被隔离的CPU收到in ...
操作系统：Linux进程与线程
这里是一部分内容,还会做修改. 一:目的及内容学习fork(),exec,pthread库函数的使用,阅读源码,分析fork,exec,pthread_create函数的机理代码实现: 进程A创建 ...
Linux 进程与线程
进程与线程进程进程就是在操作系统中运行的程序,是操作系统资源管理的最小单位.一个进程可以管理多个线程,线程相对轻量,可以共享进程地址空间线程来源一个进行在运行的过程中,不可能一直占据着CP ...

随机推荐

第一次接触mysql
一:数据库的好处 1. 可以持久化保存数据在本地 2.结构化查询二:数据库常见的概念 1.DB: 是datebase数据库的缩写,储存数据得到容器 2.DBMS:数据库管理系统,用于管理数据库,和创 ...
ZLG zigbee 虚拟串口配置
一.设置网关工作模式: 在ZNetCom Utility工具中,将设置网关工作模式为 Real COM 模式启动 ZNetCom Utility 搜索设备获得设备信息修改工作模式为:real c ...
%ROWTYPE在INSERT和UPDATE语句里的妙用
PL/SQL里的ROWTYPE类型具有非常大的用处和灵活性,现在发现ROWTYPE在insert和update语句里的妙用,可以节省很多代码,特别是在行copy和更新的时候. 在INSERT语句中: ...
.net 导出Excel插件Npoi的使用
1.NuGet搜索Npoi并安装 2.添加引用将包引用进来 3.Controller里引用 4.使用 public ActionResult ExportExcel() { plist = 数据源 H ...
重写Alert和confirm方法去除地址显示
//重写alert方法,去掉地址显示window.alert = function(name){var iframe = document.createElement("IFRAME&quo ...
【模板】素数测试（Miller-Rabin测试）
基础素数测试模板对于大数的素性判断,目前Miller-Rabin算法应用最广泛.一般底数仍然是随机选取,但当待测数不太大时,选择测试底数就有一些技巧了.比如,如果被测数小于4759123141,那 ...
linux系统之-vi编辑器
在linux系统使用中,掌握熟练的vi编辑器,可以提高linux工作效率.那么vi编辑器的使用方法有哪些呢? vi编辑器可在绝大部分linux发行版中使用. Vi编辑器的作用:创建或修改文件:维护li ...
Eclipse build时间太长，无法忍受，完美解决方案，Eclipse 编译太卡，耗时太长
目前开发使用了Eclipse ,每次报错的时候都会build,,每次build的时间都很长,接近10秒左右,好难受呀.. 刚开始一直以为是项目内容多导致的,但是想想之前做的项目,无论再多,也都是秒级的 ...
Python基本图形绘制
turtle的一个画布空间最小单位是像素 turtle的绘制窗体:turtle.stup(width,heigth,startx,starty) 四个参数中后两个可选 turtle空间坐标体系:tur ...
spring-boot整合ehcache实现缓存机制
EhCache 是一个纯Java的进程内缓存框架,具有快速.精干等特点,是Hibernate中默认的CacheProvider. ehcache提供了多种缓存策略,主要分为内存和磁盘两级,所以无需担心 ...

Linux 进程,线程,线程池

Linux 进程,线程,线程池的更多相关文章

随机推荐

热门专题