Linux内核分析第七次作业

分析Linux内核创建一个新进程的过程

Linux中创建进程一共有三个函数：

  1. fork，创建子进程

  2. vfork，与fork类似，但是父子进程共享地址空间，而且子进程先于父进程运行。

  3. clone，主要用于创建线程

实验部分

使用gdb进行跟踪调试
设置断点
部分调试内容

进程创建的大概过程

SYSCALL_DEFINE0(fork)

{

    return do_fork(SIGCHLD, 0, 0, NULL, NULL);

}

#endif

SYSCALL_DEFINE0(vfork)

{

    return do_fork(CLONE_VFORK | CLONE_VM | SIGCHLD, 0,

            0, NULL, NULL);

}

SYSCALL_DEFINE5(clone, unsigned long, clone_flags, unsigned long, newsp,

         int __user *, parent_tidptr,

         int __user *, child_tidptr,

         int, tls_val)

{

    return do_fork(clone_flags, newsp, 0, parent_tidptr, child_tidptr);

}

通过上面的代码可以看出，fork、vfork和clone这三个函数最终都是通过do_fork函数实现的。

追踪do_fork的代码：

long do_fork(unsigned long clone_flags,

          unsigned long stack_start,

          unsigned long stack_size,

          int __user *parent_tidptr,

          int __user *child_tidptr)

{

    struct task_struct *p;

    int trace = 0;

    long nr;

    // ...

    // 复制进程描述符，返回创建的task_struct的指针

    p = copy_process(clone_flags, stack_start, stack_size,

             child_tidptr, NULL, trace);

    if (!IS_ERR(p)) {

        struct completion vfork;

        struct pid *pid;

        trace_sched_process_fork(current, p);

        // 取出task结构体内的pid

        pid = get_task_pid(p, PIDTYPE_PID);

        nr = pid_vnr(pid);

        if (clone_flags & CLONE_PARENT_SETTID)

            put_user(nr, parent_tidptr);

        // 如果使用的是vfork，那么必须采用某种完成机制，确保父进程后运行

        if (clone_flags & CLONE_VFORK) {

            p->vfork_done = &vfork;

            init_completion(&vfork);

            get_task_struct(p);

        }

        // 将子进程添加到调度器的队列，使得子进程有机会获得CPU

        wake_up_new_task(p);

        // ...

        // 如果设置了 CLONE_VFORK 则将父进程插入等待队列，并挂起父进程直到子进程释放自己的内存空间

        // 保证子进程优先于父进程运行

        if (clone_flags & CLONE_VFORK) {

            if (!wait_for_vfork_done(p, &vfork))

                ptrace_event_pid(PTRACE_EVENT_VFORK_DONE, pid);

        }

        put_pid(pid);

    } else {

        nr = PTR_ERR(p);

    }

    return nr;

}

do_fork的步骤：

1. 调用copy_process，将当期进程复制一份出来为子进程，并且为子进程设置相应地上下文信息。

2. 初始化vfork的完成处理信息（如果是vfork调用）

3. 调用wake_up_new_task，将子进程放入调度器的队列中，此时的子进程就可以被调度进程选中，得以运行。

4. 如果是vfork调用，需要阻塞父进程，知道子进程执行exec。

进程创建的关键-copy_process

/*

    创建进程描述符以及子进程所需要的其他所有数据结构

    为子进程准备运行环境

*/

static struct task_struct *copy_process(unsigned long clone_flags,

                    unsigned long stack_start,

                    unsigned long stack_size,

                    int __user *child_tidptr,

                    struct pid *pid,

                    int trace)

{

    int retval;

    struct task_struct *p;

    // 分配一个新的task_struct，此时的p与当前进程的task，仅仅是stack地址不同

    p = dup_task_struct(current);

    // 检查该用户的进程数是否超过限制

    if (atomic_read(&p->real_cred->user->processes) >=

            task_rlimit(p, RLIMIT_NPROC)) {

        // 检查该用户是否具有相关权限，不一定是root

        if (p->real_cred->user != INIT_USER &&

            !capable(CAP_SYS_RESOURCE) && !capable(CAP_SYS_ADMIN))

            goto bad_fork_free;

    }

    retval = -EAGAIN;

    // 检查进程数量是否超过 max_threads，后者取决于内存的大小

    if (nr_threads >= max_threads)

        goto bad_fork_cleanup_count;

    // 初始化自旋锁

    // 初始化挂起信号

    // 初始化定时器

    // 完成对新进程调度程序数据结构的初始化，并把新进程的状态设置为TASK_RUNNING

    retval = sched_fork(clone_flags, p);

    // .....

    // 复制所有的进程信息

    // copy_xyz

    // 初始化子进程的内核栈

    retval = copy_thread(clone_flags, stack_start, stack_size, p);

    if (retval)

        goto bad_fork_cleanup_io;

    if (pid != &init_struct_pid) {

        retval = -ENOMEM;

        // 这里为子进程分配了新的pid号

        pid = alloc_pid(p->nsproxy->pid_ns_for_children);

        if (!pid)

            goto bad_fork_cleanup_io;

    }

    /* ok, now we should be set up.. */

    // 设置子进程的pid

    p->pid = pid_nr(pid);

    // 如果是创建线程

    if (clone_flags & CLONE_THREAD) {

        p->exit_signal = -1;

        // 线程组的leader设置为当前线程的leader

        p->group_leader = current->group_leader;

        // tgid是当前线程组的id，也就是main进程的pid

        p->tgid = current->tgid;

    } else {

        if (clone_flags & CLONE_PARENT)

            p->exit_signal = current->group_leader->exit_signal;

        else

            p->exit_signal = (clone_flags & CSIGNAL);

        // 创建的是进程，自己是一个单独的线程组

        p->group_leader = p;

        // tgid和pid相同

        p->tgid = p->pid;

    }

    if (clone_flags & (CLONE_PARENT|CLONE_THREAD)) {

        // 如果是创建线程，那么同一线程组内的所有线程、进程共享parent

        p->real_parent = current->real_parent;

        p->parent_exec_id = current->parent_exec_id;

    } else {

        // 如果是创建进程，当前进程就是子进程的parent

        p->real_parent = current;

        p->parent_exec_id = current->self_exec_id;

    }

    // 将pid加入PIDTYPE_PID这个散列表

    attach_pid(p, PIDTYPE_PID);

    // 递增 nr_threads的值

    nr_threads++;

    // 返回被创建的task结构体指针

    return p;

}

copy_process流程：

1. 检查各种标志位

2. 调用dup_task_struct复制一份task_struct结构体，作为子进程的进程描述符。

3. 检查进程的数量限制。

4. 初始化定时器、信号和自旋锁。

5. 初始化与调度有关的数据结构，调用了sched_fork，这里将子进程的state设置为TASK_RUNNING。

6. 复制所有的进程信息，包括fs、信号处理函数、信号、内存空间（包括写时复制）等。

7. 调用copy_thread，这又是关键的一步，这里设置了子进程的堆栈信息。

8. 为子进程分配一个pid

9. 设置子进程与其他进程的关系，以及pid、tgid等。这里主要是对线程做一些区分。

copy_thread函数为子进程准备了上下文堆栈信息。代码如下：

// 初始化子进程的内核栈

int copy_thread(unsigned long clone_flags, unsigned long sp,

    unsigned long arg, struct task_struct *p)

{

    // 获取寄存器信息

    struct pt_regs *childregs = task_pt_regs(p);

    struct task_struct *tsk;

    int err;

    // 栈顶 空栈

    p->thread.sp = (unsigned long) childregs;

    p->thread.sp0 = (unsigned long) (childregs+1);

    memset(p->thread.ptrace_bps, 0, sizeof(p->thread.ptrace_bps));

    // 如果是创建的内核线程

    if (unlikely(p->flags & PF_KTHREAD)) {

        /* kernel thread */

        memset(childregs, 0, sizeof(struct pt_regs));

        // 内核线程开始执行的位置

        p->thread.ip = (unsigned long) ret_from_kernel_thread;

        task_user_gs(p) = __KERNEL_STACK_CANARY;

        childregs->ds = __USER_DS;

        childregs->es = __USER_DS;

        childregs->fs = __KERNEL_PERCPU;

        childregs->bx = sp; /* function */

        childregs->bp = arg;

        childregs->orig_ax = -1;

        childregs->cs = __KERNEL_CS | get_kernel_rpl();

        childregs->flags = X86_EFLAGS_IF | X86_EFLAGS_FIXED;

        p->thread.io_bitmap_ptr = NULL;

        return 0;

    }

    // 将当前进程的寄存器信息复制给子进程

    *childregs = *current_pt_regs();

    // 子进程的eax置为0，所以fork的子进程返回值为0

    childregs->ax = 0;

    if (sp)

        childregs->sp = sp;

    // 子进程从ret_from_fork开始执行

    p->thread.ip = (unsigned long) ret_from_fork;

    task_user_gs(p) = get_user_gs(current_pt_regs());

    return err;

}

copy_thread的流程如下：

1. 获取子进程寄存器信息的存放位置

2. 对子进程的thread.sp赋值，将来子进程运行，这就是子进程的esp寄存器的值。

3. 如果是创建内核线程，那么它的运行位置是ret_from_kernel_thread，将这段代码的地址赋给thread.ip，之后准备其他寄存器信息，退出

4. 将父进程的寄存器信息复制给子进程。

5. 将子进程的eax寄存器值设置为0，所以fork调用在子进程中的返回值为0.

6. 子进程从ret_from_fork开始执行，所以它的地址赋给thread.ip，也就是将来的eip寄存器。

结论：子进程从ret_from_fork处开始执行。

总结及问题

1. dup_task_struct中为其分配了新的堆栈

2. copy_process中调用了sched_fork，将其置为TASK_RUNNING

3. copy_thread中将父进程的寄存器上下文复制给子进程，这是非常关键的一步，这里保证了父子进程的堆栈信息是一致的。

4. 将ret_from_fork的地址设置为eip寄存器的值，这是子进程的第一条指令。

问题：

Linux内核分析第七次作业的更多相关文章

LINUX内核分析第七周学习总结：可执行程序的装载
LINUX内核分析第七周学习总结:可执行程序的装载韩玉琪 + 原创作品转载请注明出处 + <Linux内核分析>MOOC课程http://mooc.study.163.com/cours ...
Linux内核分析（七）----并发与竞态
原文:Linux内核分析(七)----并发与竞态 Linux内核分析(七) 这两天家里的事好多,我们今天继续接着上一次的内容学习,上次我们完善了字符设备控制方法,并深入分析了系统调用的实质,今天我们主 ...
Linux内核分析第七周可执行程序的装载
张嘉琪原创作品转载请注明出处 <Linux内核分析>MOOC课程http://mooc.study.163.com/course/USTC-1000029000 Linux内核分析第七 ...
LINUX内核分析第七周学习总结
LINUX内核分析第七周学习总结标签(空格分隔): 20135328陈都陈都原创作品转载请注明出处 <Linux内核分析>MOOC课程 http://mooc.study.163.c ...
Linux内核分析第七周———可执行程序的装载
Linux内核分析第七周---可执行程序的装载李雪琦+原创作品转载请注明出处 + <Linux内核分析>MOOC课程http://mooc.study.163.com/course/US ...
Linux内核分析第七周学习笔记——Linux内核如何装载和启动一个可执行程序
Linux内核分析第七周学习笔记--Linux内核如何装载和启动一个可执行程序 zl + 原创作品转载请注明出处 + <Linux内核分析>MOOC课程http://mooc.study. ...
LINUX内核分析第七周学习总结——可执行程序的装载
LINUX内核分析第六周学习总结——进程的描述和进程的创建张忻(原创作品转载请注明出处) <Linux内核分析>MOOC课程http://mooc.study.163.com/cours ...
20135327郭皓--Linux内核分析第七周可执行程序的装载
第七周可执行程序的装载郭皓原创作品转载请注明出处 <Linux内核分析>MOOC课程 http://mooc.study.163.com/course/USTC-1000029000 ...
linux内核分析第七周
一.课堂相关 (一)预处理.编译.链接和目标文件的格式 1.可执行程序是怎么得来的 C代码--预处理--汇编代码--目标代码--可执行文件预处理负责把include的文件包含进来及宏替换工作. he ...

随机推荐

itsdangerous
将字典进行加密.解密通过私钥保证安全性 serializer=TimedJSONWebSignatureSerializer(私钥,过期时间) dumps(字典)=====>返回加密字符串 l ...
[C#]中获取当前程序运行路径的方法
获取当前程序运行路径: ①//获取当前 Thread 的当前应用程序域的基目录,它由程序集冲突解决程序用来探测程序集.string str = System.AppDomain.CurrentDoma ...
[Spring MVC] 表单提交日期转换问题,比如可能导致封装实体类时400错误
三种格式的InitBinder @InitBinder//https://stackoverflow.com/questions/20616319/the-request-sent-by-the-cl ...
20190319xlVBA_根据考勤数据统计缺勤缺考数据
Sub SubtotalPickFile() Dim StartTime As Variant Dim UsedTime As Variant StartTime = VBA.Timer Dim fi ...
pymysql的使用与参数简要
pymysql.Connect()参数说明 host(str): MySQL服务器地址 port(int): MySQL服务器端口号 user(str): 用户名 passwd(str): 密码 db ...
openssl dgst(生成和验证数字签名)
openssl系列文章:http://www.cnblogs.com/f-ck-need-u/p/7048359.html 该伪命令是单向加密工具,用于生成文件的摘要信息,也可以进行数字签名,验证数字 ...
python入门-基础语法
一.变量定义字符串要加单引号‘’ 变量命名规范: 变量名只能是字母.数字或下划线的任意组合变量名的第一个字符不能是数字变量名不能用关键字变量名不要用中文变量名不要太长,区分大小写面就用单引 ...
5、Angular的一些其他核心特性，学习的主要模块
Angular应用程序的八个主要构造块: 模块组件模板元数据数据绑定指令服务依赖注入其他重要的Angular特性和服务: 动画表单 HTTP 组件生命周期管道过滤器路由测试
Dropout, DropConnect ——一个对输出，一个对输入
Deep learning: Dropout, DropConnect from:https://www.jianshu.com/p/b349c4c82da3 Dropout 训练神经网络模型时,如果 ...
boost高质量随机数库 zhuan
shared_ptr<int> tmp2(new int(10)) ; int * test=tmp2.get(); std::cout<<*test<<" ...

Linux内核分析第七次作业

分析Linux内核创建一个新进程的过程

Linux中创建进程一共有三个函数：

实验部分

进程创建的大概过程

进程创建的关键-copy_process

总结及问题

Linux内核分析第七次作业的更多相关文章

随机推荐

热门专题