在linux内核,线程与进程的区别很小,或者说内核并没有真正所谓单独的线程的概念,进程的创建函数是fork,而线程的创建是通过clone实现的。

而clone与fork都是调用do_fork(),差异如下:

 SYSCALL_DEFINE0(fork)
{
return do_fork(SIGCHLD, , , NULL, NULL);
} SYSCALL_DEFINE5(clone, unsigned long, clone_flags, unsigned long, newsp,
int __user *, parent_tidptr,
int __user *, child_tidptr,
int, tls_val)
{
return do_fork(clone_flags, newsp, , parent_tidptr, child_tidptr);
}

实际上就是内核开放大部分参数和do_fork接口来创建线程,看clone的官方解释:

The main use of clone() is to implement threads: multiple threads of control in a program that run concurrently in a shared memory space.

所以接下来参考glibc 2.25版本的pthread_create来看看进程和线程的具体实现差异在哪里:

 const int clone_flags = (CLONE_VM | CLONE_FS | CLONE_FILES | CLONE_SYSVSEM
| CLONE_SIGHAND | CLONE_THREAD
| CLONE_SETTLS | CLONE_PARENT_SETTID
| CLONE_CHILD_CLEARTID
| );

显而易见clone_flags的差别非常大.

下面再来通过这些flags的作用来区分进程和线程的特性,细数之前先看看do_fork的实现,发现有意思的是,ptrace和perf这2个调试工具也是进程创建的时候初始化的.

1、CLONE_VM

首先线程不能脱离父进程独立存在,所以它需要共享父进程的虚拟内存空间

2、CLONE_FS | CLONE_FILES

线程做为父进程一个CPU执行单元,它可以直接使用父进程的文件系统信息(包括文件系统根目录,当前工作目录,和文件访问权限)而不需要自己独立创建和持有这些资源和父进程打开的文件描述符

3、CLONE_SIGHAND | CLONE_THREAD

线程还接着共享父进程的异步信号处理函数,即父进程能收到的异步信号,它也能收到并处理,不过线程可以自行通过sigprocmask来屏蔽或不屏蔽某些异步信号操作,而不影响其他线程。

4、CLONE_SYSVSEM

线程共享父进程的System V semaphore。

5、CLONE_SETTLS

线程支持TLS (Thread Local Storage)。TLS使得变量每一个线程有一份独立实体,各个线程的值互不干扰

6、CLONE_PARENT_SETTID

父进程和线程会将线程ID保存在内核任务结构体的ptid成员。

7、CLONE_CHILD_CLEARTID

清除内核任务结构体的ctid成员上存储的线程ID。

8、CLONE_THREAD

将线程放入到父进程的线程组(thread group)里,这样线程在用户态就看不到自己进程ID了,只能看到父进程的进程ID,并且线程共享父进程的异步信号。

子进程则会复制父进程的很多进程信息,复制与共享的区别还是很大的,复制需要重新申请内核资源,所以开销比线程大很多。

1、创建进程的时候没有指定 CLONE_VM | CLONE_FS | CLONE_FILES | CLONE_SIGHAND,所以这些它需要复制进程的,所以父进程这些信息也被子进程继承过去了,但是已经独立存在在子进程里了,以后就没有关系了。

2、子进程还复制父进程的信号处理函数和信号;

3、线程和子进程都会继承(复制)父进程的普通优先级,父进程的栈,CPU状态会被设置为RUNNING。

总结一下:

1、进程,线程的创建还有很多细节,我这里没有完全列举出来,只列举了我觉得比较重要的部分。

2、线程,进程的最大区别就是,啃老还是不啃老,通过上面来看,线程就是个啃老的货,而进程是个依靠父母独立成长的好孩子,然并卵,事实证明,不管是现实世界还是计算机这个虚拟世界,越独立就越占用资源!

4、所以,多用线程可以降低系统资源的消耗。

上面讲到要多用线程,下面就轮到线程池要出场了,但是这个世界总是有很多熊孩子,就喜欢不停给他老子搞事情,严重到。。。咳咳,我们还是严肃的描述吧:

严重到不停的创建线程,销毁线程,这就增加了内核的开销了,更有甚之,有的线程函数无比简短,可能线程刚创建完就要销毁了。。。

所以避免出现这样的情况,很多场合需要用到进程池。

关于pthread可以参考如下文章:

http://www.ibm.com/developerworks/cn/linux/thread/posix_threadapi/part1/

https://www.ibm.com/developerworks/cn/linux/thread/posix_threadapi/part2/

https://www.ibm.com/developerworks/cn/linux/thread/posix_threadapi/part3/

https://www.ibm.com/developerworks/cn/linux/thread/posix_threadapi/part4/

https://www.ibm.com/developerworks/cn/linux/thread/posix_threadapi/part5/

Linux 进程,线程,线程池的更多相关文章

  1. Linux进程或线程绑定到CPU

    Linux进程或线程绑定到CPU 为了让程序拥有更好的性能,有时候需要将进程或线程绑定到特定的CPU,这样可以减少调度的开销和保护关键进程或线程. 进程绑定到CPU Linux提供一个接口,可以将进程 ...

  2. Linux进程和线程的比較

    进程与线程 參考:http://www.cnblogs.com/blueclue/archive/2010/07/16/1778855.html 首先比較Linux进程和线程的创建的差别,以此展开: ...

  3. Linux 进程、线程运行在指定CPU核上

    /******************************************************************************** * Linux 进程.线程运行在指定 ...

  4. Linux进程与线程的区别

    进程与线程的区别,早已经成为了经典问题.自线程概念诞生起,关于这个问题的讨论就没有停止过.无论是初级程序员,还是资深专家,都应该考虑过这个问题,只是层次角度不同罢了.一般程序员而言,搞清楚二者的概念, ...

  5. linux进程、线程与cpu的亲和性(affinity)

    参考:http://www.cnblogs.com/wenqiang/p/6049978.html 最近的工作中对性能的要求比较高,下面简单做一下总结: 一.什么是cpu亲和性(affinity) C ...

  6. linux进程与线程的区别【转】

    知乎上总结: "linux使用的1:1的线程模型,在内核中是不区分线程和进程的,都是可运行的任务而已.fork调用clone(最少的共享),pthread_create也是调用clone(最 ...

  7. Linux进程和线程

    一.进程产生的方式 1.描述进程的ID号通常叫做PID,即进程ID,PID的变量类型为pid_t. 2.getpid(void)返回当前进程的ID号,getppid(void)返回当前进程的父进程的I ...

  8. Linux -- 进程或线程独占CPU

    如果想让特定进程或线程独占某一或某些CPU,我们需要做三件事. 一,隔离CPU,避免其它线程run在被隔离的CPU上. 二,绑定所有的interrupts到非隔离的CPU上,避免被隔离的CPU收到in ...

  9. 操作系统:Linux进程与线程

    这里是一部分内容,还会做修改. 一:目的及内容 学习fork(),exec,pthread库函数的使用,阅读源码,分析fork,exec,pthread_create函数的机理 代码实现: 进程A创建 ...

  10. Linux 进程与线程

    进程与线程   进程 进程就是在操作系统中运行的程序,是操作系统资源管理的最小单位.一个进程可以管理多个线程,线程相对轻量,可以共享进程地址空间 线程来源 一个进行在运行的过程中,不可能一直占据着CP ...

随机推荐

  1. java8新特性学习2

    六.Stream API Java8中有两大最为重要的改变.第一个是 Lambda 表达式:另外一个则是 Stream API(java.util.stream.*).Stream 是 Java8 中 ...

  2. c# LRU实现的缓存类

    在网上找到网友中的方法,将其修改整理后,实现了缓存量控制以及时间控制,如果开启缓存时间控制,会降低效率. 定义枚举,移除时使用 public enum RemoveType    {        [ ...

  3. MySQL字段的属性应该尽量设置为NOT NULL

    数据库建表时,对于一些可填可不填的字段,我们应该尽量把它设置为 NOT NULL.这种做法即可以提高性能,又可以在很大程度上避免空指针类的问题,好处颇多. 1.节省空间 NULL 列需要更多的存储空间 ...

  4. ubuntu部署kubeadm1.13.1高可用

    kubeadm的主要特性已经GA了,网上看很多人说1.13有bug在1.13.1进行的更新,具体我也没怎么看,有兴趣的朋友可以查查,不过既然有人提到了我们就不要再去踩雷了,就用现在的1.13.1来部署 ...

  5. oracle调度中使用schedule管理调度

    开始前,先说一句:作为dba应该禁止所有应用使用dbms_job. dbms_scheduler非常复杂,oracle在两本书中专门花费不少章节描述,这两本书分别是: Oracle® Database ...

  6. Python3 operator模块关联代替Python2 cmp() 函数

    Python2 cmp() 函数 描述 cmp(x,y) 函数用于比较2个对象,如果 x < y 返回 -1, 如果 x == y 返回 0, 如果 x > y 返回 1. Python ...

  7. 模块importlib介绍

    importlib包的目的是双重的.一个是在Python源代码中提供import语句(以及扩展名为__import__()函数)的实现.这提供了可以移植到任何Python解释器的import的实现.这 ...

  8. javascript--BOM的onload事件和onunload事件

    1.onload事件 onload,页面加载后执行,所谓页面加载完成,指页面上所有的元素创建完毕,引用的所有的外部资源(js.css.图片)等下载完毕. 所以onload执行的比较晚,因为如果页面上有 ...

  9. vue-cli中vuex IE兼容

    vue2.0 兼容ie9及其以上 vue-cli中使用vuex的项目 在IE中会出现页面空白 控制台报错的情况:我们只需要安装一个插件,然后在main.js中全局引入即可 安装 npm install ...

  10. haystack+Elasticsearch搜素引擎

    搜索引擎原理 通过搜索引擎进行数据查询时,搜索引擎并不是直接在数据库中进行查询,而是搜索引擎会对数据库中的数据进行一遍预处理,单独建立起一份索引结构数据. 我们可以将索引结构数据想象成是字典书籍的索引 ...