侯体宗的博客
  • 首页
  • Hyperf版
  • beego仿版
  • 人生(杂谈)
  • 技术
  • 关于我
  • 更多分类
    • 文件下载
    • 文字修仙
    • 中国象棋ai
    • 群聊
    • 九宫格抽奖
    • 拼图
    • 消消乐
    • 相册

浅谈Linux内核创建新进程的全过程

linux  /  管理员 发布于 7年前   166

进程描述

  • 进程描述符(task_struct)

用来描述进程的数据结构,可以理解为进程的属性。比如进程的状态、进程的标识(PID)等,都被封装在了进程描述符这个数据结构中,该数据结构被定义为task_struct

  • 进程控制块(PCB)

是操作系统核心中一种数据结构,主要表示进程状态。

  • 进程状态

  • fork()

fork()在父、子进程各返回一次。在父进程中返回子进程的 pid,在子进程中返回0。

fork一个子进程的代码

 

#include <stdio.h>#include <stdlib.h>#include <unistd.h>int main(int argc, char * argv[]){int pid;/* fork another process */pid = fork();if (pid < 0) {   /* error occurred */  fprintf(stderr,"Fork Failed!");  exit(-1);} else if (pid == 0) {  /* child process */  printf("This is Child Process!\n");} else {   /* parent process */  printf("This is Parent Process!\n");  /* parent will wait for the child to complete*/  wait(NULL);  printf("Child Complete!\n");}}

进程创建

1、大致流程

fork 通过0x80中断(系统调用)来陷入内核,由系统提供的相应系统调用来完成进程的创建。

fork.c//fork#ifdef __ARCH_WANT_SYS_FORKSYSCALL_DEFINE0(fork){#ifdef CONFIG_MMU  return do_fork(SIGCHLD, 0, 0, NULL, NULL);#else  /* can not support in nommu mode */  return -EINVAL;#endif}#endif//vfork#ifdef __ARCH_WANT_SYS_VFORKSYSCALL_DEFINE0(vfork){  return do_fork(CLONE_VFORK | CLONE_VM | SIGCHLD, 0,      0, NULL, NULL);}#endif//clone#ifdef __ARCH_WANT_SYS_CLONE#ifdef CONFIG_CLONE_BACKWARDSSYSCALL_DEFINE5(clone, unsigned long, clone_flags, unsigned long, newsp,     int __user *, parent_tidptr,     int, tls_val,     int __user *, child_tidptr)#elif defined(CONFIG_CLONE_BACKWARDS2)SYSCALL_DEFINE5(clone, unsigned long, newsp, unsigned long, clone_flags,     int __user *, parent_tidptr,     int __user *, child_tidptr,     int, tls_val)#elif defined(CONFIG_CLONE_BACKWARDS3)SYSCALL_DEFINE6(clone, unsigned long, clone_flags, unsigned long, newsp,    int, stack_size,    int __user *, parent_tidptr,    int __user *, child_tidptr,    int, tls_val)#elseSYSCALL_DEFINE5(clone, unsigned long, clone_flags, unsigned long, newsp,     int __user *, parent_tidptr,     int __user *, child_tidptr,     int, tls_val)#endif{  return do_fork(clone_flags, newsp, 0, parent_tidptr, child_tidptr);}#endif

通过看上边的代码,我们可以清楚的看到,不论是使用 fork 还是 vfork 来创建进程,最终都是通过 do_fork() 方法来实现的。接下来我们可以追踪到 do_fork()的代码:

long do_fork(unsigned long clone_flags,     unsigned long stack_start,     unsigned long stack_size,     int __user *parent_tidptr,     int __user *child_tidptr){    //创建进程描述符指针    struct task_struct *p;    //……    //复制进程描述符,copy_process()的返回值是一个 task_struct 指针。    p = copy_process(clone_flags, stack_start, stack_size,       child_tidptr, NULL, trace);    if (!IS_ERR(p)) {      struct completion vfork;      struct pid *pid;      trace_sched_process_fork(current, p);      //得到新创建的进程描述符中的pid      pid = get_task_pid(p, PIDTYPE_PID);      nr = pid_vnr(pid);      if (clone_flags & CLONE_PARENT_SETTID)        put_user(nr, parent_tidptr);      //如果调用的 vfork()方法,初始化 vfork 完成处理信息。      if (clone_flags & CLONE_VFORK) {        p->vfork_done = &vfork;        init_completion(&vfork);        get_task_struct(p);      }      //将子进程加入到调度器中,为其分配 CPU,准备执行      wake_up_new_task(p);      //fork 完成,子进程即将开始运行      if (unlikely(trace))        ptrace_event_pid(trace, pid);      //如果是 vfork,将父进程加入至等待队列,等待子进程完成      if (clone_flags & CLONE_VFORK) {        if (!wait_for_vfork_done(p, &vfork))          ptrace_event_pid(PTRACE_EVENT_VFORK_DONE, pid);      }      put_pid(pid);    } else {      nr = PTR_ERR(p);    }    return nr;}

2、do_fork 流程

  • 调用 copy_process 为子进程复制出一份进程信息
  • 如果是 vfork 初始化完成处理信息
  • 调用 wake_up_new_task 将子进程加入调度器,为之分配 CPU
  • 如果是 vfork,父进程等待子进程完成 exec 替换自己的地址空间

3、copy_process 流程

追踪copy_process 代码(部分)

static struct task_struct *copy_process(unsigned long clone_flags,          unsigned long stack_start,          unsigned long stack_size,          int __user *child_tidptr,          struct pid *pid,          int trace){  int retval;  //创建进程描述符指针  struct task_struct *p;  //……  //复制当前的 task_struct  p = dup_task_struct(current);  //……  //初始化互斥变量    rt_mutex_init_task(p);  //检查进程数是否超过限制,由操作系统定义  if (atomic_read(&p->real_cred->user->processes) >=      task_rlimit(p, RLIMIT_NPROC)) {    if (p->real_cred->user != INIT_USER &&      !capable(CAP_SYS_RESOURCE) && !capable(CAP_SYS_ADMIN))      goto bad_fork_free;  }  //……  //检查进程数是否超过 max_threads 由内存大小决定  if (nr_threads >= max_threads)    goto bad_fork_cleanup_count;  //……  //初始化自旋锁  spin_lock_init(&p->alloc_lock);  //初始化挂起信号  init_sigpending(&p->pending);  //初始化 CPU 定时器  posix_cpu_timers_init(p);  //……  //初始化进程数据结构,并把进程状态设置为 TASK_RUNNING  retval = sched_fork(clone_flags, p);  //复制所有进程信息,包括文件系统、信号处理函数、信号、内存管理等  if (retval)    goto bad_fork_cleanup_policy;  retval = perf_event_init_task(p);  if (retval)    goto bad_fork_cleanup_policy;  retval = audit_alloc(p);  if (retval)    goto bad_fork_cleanup_perf;  /* copy all the process information */  shm_init_task(p);  retval = copy_semundo(clone_flags, p);  if (retval)    goto bad_fork_cleanup_audit;  retval = copy_files(clone_flags, p);  if (retval)    goto bad_fork_cleanup_semundo;  retval = copy_fs(clone_flags, p);  if (retval)    goto bad_fork_cleanup_files;  retval = copy_sighand(clone_flags, p);  if (retval)    goto bad_fork_cleanup_fs;  retval = copy_signal(clone_flags, p);  if (retval)    goto bad_fork_cleanup_sighand;  retval = copy_mm(clone_flags, p);  if (retval)    goto bad_fork_cleanup_signal;  retval = copy_namespaces(clone_flags, p);  if (retval)    goto bad_fork_cleanup_mm;  retval = copy_io(clone_flags, p);  //初始化子进程内核栈  retval = copy_thread(clone_flags, stack_start, stack_size, p);  //为新进程分配新的 pid  if (pid != &init_struct_pid) {    retval = -ENOMEM;    pid = alloc_pid(p->nsproxy->pid_ns_for_children);    if (!pid)      goto bad_fork_cleanup_io;  }  //设置子进程 pid   p->pid = pid_nr(pid);  //……  //返回结构体 p  return p;
  • 调用 dup_task_struct 复制当前的 task_struct
  • 检查进程数是否超过限制
  • 初始化自旋锁、挂起信号、CPU 定时器等
  • 调用 sched_fork 初始化进程数据结构,并把进程状态设置为 TASK_RUNNING
  • 复制所有进程信息,包括文件系统、信号处理函数、信号、内存管理等
  • 调用 copy_thread 初始化子进程内核栈
  • 为新进程分配并设置新的 pid

4、dup_task_struct 流程 

static struct task_struct *dup_task_struct(struct task_struct *orig){  struct task_struct *tsk;  struct thread_info *ti;  int node = tsk_fork_get_node(orig);  int err;  //分配一个 task_struct 节点  tsk = alloc_task_struct_node(node);  if (!tsk)    return NULL;  //分配一个 thread_info 节点,包含进程的内核栈,ti 为栈底  ti = alloc_thread_info_node(tsk, node);  if (!ti)    goto free_tsk;  //将栈底的值赋给新节点的栈  tsk->stack = ti;  //……  return tsk;}

调用alloc_task_struct_node分配一个 task_struct 节点
调用alloc_thread_info_node分配一个 thread_info 节点,其实是分配了一个thread_union联合体,将栈底返回给 ti

union thread_union {  struct thread_info thread_info; unsigned long stack[THREAD_SIZE/sizeof(long)];};

最后将栈底的值 ti 赋值给新节点的栈
最终执行完dup_task_struct之后,子进程除了tsk->stack指针不同之外,全部都一样!
5、sched_fork 流程

core.c

int sched_fork(unsigned long clone_flags, struct task_struct *p){  unsigned long flags;  int cpu = get_cpu();  __sched_fork(clone_flags, p);  //将子进程状态设置为 TASK_RUNNING  p->state = TASK_RUNNING;  //……  //为子进程分配 CPU  set_task_cpu(p, cpu);  put_cpu();  return 0;}

我们可以看到sched_fork大致完成了两项重要工作,一是将子进程状态设置为 TASK_RUNNING,二是为其分配 CPU
6、copy_thread 流程

int copy_thread(unsigned long clone_flags, unsigned long sp,  unsigned long arg, struct task_struct *p){  //获取寄存器信息  struct pt_regs *childregs = task_pt_regs(p);  struct task_struct *tsk;  int err;  p->thread.sp = (unsigned long) childregs;  p->thread.sp0 = (unsigned long) (childregs+1);  memset(p->thread.ptrace_bps, 0, sizeof(p->thread.ptrace_bps));  if (unlikely(p->flags & PF_KTHREAD)) {    //内核线程    memset(childregs, 0, sizeof(struct pt_regs));    p->thread.ip = (unsigned long) ret_from_kernel_thread;    task_user_gs(p) = __KERNEL_STACK_CANARY;    childregs->ds = __USER_DS;    childregs->es = __USER_DS;    childregs->fs = __KERNEL_PERCPU;    childregs->bx = sp; /* function */    childregs->bp = arg;    childregs->orig_ax = -1;    childregs->cs = __KERNEL_CS | get_kernel_rpl();    childregs->flags = X86_EFLAGS_IF | X86_EFLAGS_FIXED;    p->thread.io_bitmap_ptr = NULL;    return 0;  }  //将当前寄存器信息复制给子进程  *childregs = *current_pt_regs();  //子进程 eax 置 0,因此fork 在子进程返回0  childregs->ax = 0;  if (sp)    childregs->sp = sp;  //子进程ip 设置为ret_from_fork,因此子进程从ret_from_fork开始执行  p->thread.ip = (unsigned long) ret_from_fork;  //……  return err;}

copy_thread 这段代码为我们解释了两个相当重要的问题!
一是,为什么 fork 在子进程中返回0,原因是childregs->ax = 0;这段代码将子进程的 eax 赋值为0
二是,p->thread.ip = (unsigned long) ret_from_fork;将子进程的 ip 设置为 ret_form_fork 的首地址,因此子进程是从 ret_from_fork 开始执行的
总结

新进程的执行源于以下前提:

  • dup_task_struct中为其分配了新的堆栈
  • 调用了sched_fork,将其置为TASK_RUNNING
  • copy_thread中将父进程的寄存器上下文复制给子进程,保证了父子进程的堆栈信息是一致的
  • 将ret_from_fork的地址设置为eip寄存器的值

最终子进程从ret_from_fork开始执行。

以上就是针对Linux内核创建一个新进程的过程的详细分析,希望对大家的学习有所帮助。


  • 上一条:
    简单实现linux聊天室程序
    下一条:
    linux安装apache过程中注意的问题
  • 昵称:

    邮箱:

    0条评论 (评论内容有缓存机制,请悉知!)
    最新最热
    • 分类目录
    • 人生(杂谈)
    • 技术
    • linux
    • Java
    • php
    • 框架(架构)
    • 前端
    • ThinkPHP
    • 数据库
    • 微信(小程序)
    • Laravel
    • Redis
    • Docker
    • Go
    • swoole
    • Windows
    • Python
    • 苹果(mac/ios)
    • 相关文章
    • 在Linux系统中使用Iptables实现流量转发功能流程步骤(0个评论)
    • vim学习笔记-入门级需要了解的一些快捷键(0个评论)
    • 在centos7系统中实现分区并格式化挂载一块硬盘到/data目录流程步骤(0个评论)
    • 在Linux系统种查看某一个进程所占用的内存命令(0个评论)
    • Linux中grep命令中的10种高级用法浅析(0个评论)
    • 近期文章
    • 在go语言中使用api.geonames.org接口实现根据国际邮政编码获取地址信息功能(1个评论)
    • 在go语言中使用github.com/signintech/gopdf实现生成pdf分页文件功能(0个评论)
    • gmail发邮件报错:534 5.7.9 Application-specific password required...解决方案(0个评论)
    • 欧盟关于强迫劳动的规定的官方举报渠道及官方举报网站(0个评论)
    • 在go语言中使用github.com/signintech/gopdf实现生成pdf文件功能(0个评论)
    • Laravel从Accel获得5700万美元A轮融资(0个评论)
    • 在go + gin中gorm实现指定搜索/区间搜索分页列表功能接口实例(0个评论)
    • 在go语言中实现IP/CIDR的ip和netmask互转及IP段形式互转及ip是否存在IP/CIDR(0个评论)
    • PHP 8.4 Alpha 1现已发布!(0个评论)
    • Laravel 11.15版本发布 - Eloquent Builder中添加的泛型(0个评论)
    • 近期评论
    • 122 在

      学历:一种延缓就业设计,生活需求下的权衡之选中评论 工作几年后,报名考研了,到现在还没认真学习备考,迷茫中。作为一名北漂互联网打工人..
    • 123 在

      Clash for Windows作者删库跑路了,github已404中评论 按理说只要你在国内,所有的流量进出都在监控范围内,不管你怎么隐藏也没用,想搞你分..
    • 原梓番博客 在

      在Laravel框架中使用模型Model分表最简单的方法中评论 好久好久都没看友情链接申请了,今天刚看,已经添加。..
    • 博主 在

      佛跳墙vpn软件不会用?上不了网?佛跳墙vpn常见问题以及解决办法中评论 @1111老铁这个不行了,可以看看近期评论的其他文章..
    • 1111 在

      佛跳墙vpn软件不会用?上不了网?佛跳墙vpn常见问题以及解决办法中评论 网站不能打开,博主百忙中能否发个APP下载链接,佛跳墙或极光..
    • 2016-11
    • 2017-07
    • 2017-10
    • 2017-11
    • 2018-01
    • 2018-02
    • 2020-03
    • 2020-04
    • 2020-05
    • 2020-06
    • 2021-02
    • 2021-03
    • 2021-04
    • 2021-06
    • 2021-07
    • 2021-08
    • 2021-09
    • 2021-10
    • 2021-11
    • 2021-12
    • 2022-01
    • 2022-03
    • 2022-04
    • 2022-08
    • 2022-11
    • 2022-12
    • 2023-01
    • 2023-02
    • 2023-03
    • 2023-06
    • 2023-07
    • 2023-10
    • 2023-12
    • 2024-01
    • 2024-04
    Top

    Copyright·© 2019 侯体宗版权所有· 粤ICP备20027696号 PHP交流群

    侯体宗的博客