漫谈进程和线程 - 码农教程

为了帮助大家理解什么是进程，以厨师做蛋糕为例。厨师做蛋糕，首先需要厨师（CPU），其次，需要食谱（程序）和原料(输入数据)，而用原料做蛋糕的一些列动作的总和就是进程。某天厨师正在后厨做着蛋糕，突来听到儿子哭着跑进后厨，说自己被蜜蜂蛰了，厨师放下手中工具，并记录下当前做到哪一步了（保存上下文信息），然后拿出急救手册，按其中的说明为儿子进行处理（开始另外一个进程）。

进程概览

我们知道文件是对I/O设备的抽象，虚拟存储器是对文件和主存的抽象，指令集是对CPU的抽象，进程是对指令集和虚拟存储器的抽象。如下图所示。

进程在内存的逻辑布局

从上可知，进程包括指令集和虚拟存储器。我们着重介绍进程在虚拟存储器中的逻辑布局，它包括用户栈、堆、程序数据和程序代码，其中，用户栈从上往下生长，堆从下往上生长，程序数据和程序代码从可执行文件加载而来，将程序代码改写成汇编指令就是类似于movl、imul、addl等指令。如下图所示

此时，CPU运行到地址为304的指令，假设CPU时间片刚好用完，就需要进行进程切换，在进行进程切换之前，需要保护现场，即保存寄存器信息、PC、打开的文件，代码段地址、数据地址、堆栈信息等，这些信息称为进程的上下文。当操作系统切换到进程时，首先将进程2的上下文信息加载到操作系统中，找到PC，然后接着执行就可以了。

进程控制块（PCB）

进程的上下文信息是以某个数据结构保存在内存中的，而这种数据结构就是PCB。在Linux操作系统中PCB对应的数据结构就是task_struct，它保存着进程的重要信息。

struct task_struct{
  pid_t pid://进程号
  long state;//状态
  cputime_t utime,stime;//cpu在用户态和 核心态下执行的时间
  struct files_struct *files;//打开的文件
  struct   mm_struct  *mm;//进程使用的内存
  ...
}

进程的状态

进程的状态包括新建态、就绪态、等待态、运行态、退出态
流程：首先进程被新建，然后进入到就绪状态，此时，进程并没有进入到运行状态，而是等待CPU调度，如果被CPU调度则进入到运行态，而当时间片用完时，进程从运行态返回到就绪态，而当等待I/O操作时，则由运行态进入阻塞态。需要注意的是：只有运行态的进程拥有CPU，而处于就绪态和等待态的进程只是处于内存，等待CPU调度，因此CPU调度是一个很关键的流程。

CPU调度

像上文描述的那样，CPU调度就是到底哪个进程占有CPU，它可以分为非抢占式和抢占式。非抢占式是指调度程序一旦把CPU分配给某一进程后便让它一直运行下去，直到进程完成或发生某件事件而不能运行时，才将CPU分配给其他进程。它适合批处理系统，简单、系统开销小。抢占式是指当一个进程正在执行时，系统可以基于某种策略剥夺CPU给其他进程。剥夺的原则有优先权原则、端进程优先原则、时间片原则，它适用于交互式系统。

评价标准

公平：合理的分配CPU
响应时间：从用户输入到产生反映的时间
吞吐量：单位时间完成的任务数量
但是这些目标是矛盾的，例如：我们希望前端进程能够快速得到响应，这样一来后端进程就不能得到快速响应。

批处理系统中的调度

先来先服务（公平、FIFO队列、非抢占式）
最短作业优先（系统的平均等待时间最短，但是需要预先知道每个任务的运行时间）

交互式调度策略

轮转，每个进程分配一个固定的时间片，但是定义时间片长度是个问题，假设进程切换一次的开销为1ms，如果时间片太短，那么很多时间都浪费在切换上，例如时间片为4ms，那么20%的时间浪费在切换上；如果时间片太长，浪费时间就减少了，但是最后一个经常等待的时间就非常久，譬如，时间片100ms，浪费的时间1%，假设有50个进程，最后一个需要等待5s。
静态优先级，给每个进程赋予优先级，优先级高的先执行，优先级低的后执行，但是该方法存在一定问题：低优先级的进程存在被饿死的情况，例如新来的进程的优先级都比原来的高，怎么办呢？我们根据等待时间的增加而调整优先级大小---多级反馈队列
动态优先级---多级反馈队列，即进程的优先级会随着等待时间的增长而增长。

进程间同步

我们知道，打印机有一个缓存，叫做打印队列，如下图所示，打印队列有5个空格，就是说这个打印队列最多可以容纳5个待打印文件，打印机进程就是消费者，而其他待打印进程是生产者，生产者不断地向队列中放数据，例如：A.java、B.doc等。

临界区：多个进程需要互斥的访问共享资源，共享资源可以是变量、表和文件等，例如打印队列就是共享资源。
当生产者将队列放满时，需要等待消费者；如果消费者把所有文件都打印完了，则需要等待生产者，这就是进程间的同步问题。

进程间同步的本质

进程调度是不可控的
在机器层面，count++，count--并不是原子操作，即一条代码，对应汇编层面多条指令。两者缺一不可，如果进程调度是可控的，那么，即使count++对应多条指令，当执行完第一条指令时，发生CPU切换，进程调度控制接下来的进程还是原来的进程控制CPU。

解决方案

关闭中断缺点：把中断操作（CPU收到时钟中断以后，会检查当前进程的时间片是否用完，用完则切换）开放给应用程序，这是极其危险的事情，例如：当某个程序关闭中断之后，执行完毕之后，忘记打开中断，导致整个系统都终止了。
用硬件指令来实现锁

boolean TestAndSet(boolean *lock){
  boolean rv = *lock;
  *lock = TRUE;
  return rv;
}

// 使用TestAndSet
boolean lock = false;
do{
  while(TestAndSet(&lock)){
    ...//什么也不做
  }
  临界区
  lock = false;
  剩余区
}while(true);

注意：操作系统会锁住系统总线，防止其他CPU访问内存变量
注意TestAndSet函数中的三条指令是原子执行的

信号量

信号量S是个整形变量，除了初始化外，有两个操作，wait()、signal()。
为了确保信号量操作，需要用一种原子的方式实现它，操作系统来实现原子性。

wait(S){
  while(S<=0){
  ...//啥也不做
  }
  S--;
}
signal(S){
  S++;
}

//
semaphore mutext = 1;
wait(mutex);
进入临界区
signal(mutex);
剩余区

不能忙等问题

用硬件指令实现锁的方案和信号量方案都有忙等问题，即某个进程获得了CPU时间片，但是啥事干不了，while(S < = 0){...}

新增进程队列，当发现value<0，将当前队列加入到阻塞队列中，同时，阻塞进程，而不像之前的方法那样无限等待下去

typedef struct{
  int value;
  struct process *list;
} semaphore;

wait(semaphore *s){
  s -> value--;
  if(s->value<0){
  //把当前进程加入到s->list中
  block();
}
signal(semaphore *s){
  s -> value++;
  if(s -> value <=0){
    //从s->list取出一个进程p
    wakeup(p);
  }
}

线程

由于进程之间是相互独立的，所以进程间数据共享只能通过内核实现，开销很麻烦，因此我们提出了线程这个概念。线程之间的数据是共享的；一个进程可以只有一个线程，也可以有多个线程（一个进程至少有一个线程）；当一个进程有多个线程时，每个线程都有一套独立的寄存器和堆栈信息，而代码、数据和文件是共享的，如下图所示。

线程的实现

完全在用户层实现（当用户要执行硬件设备，必须从用户空间到内核空间，这是一种保护措施，保护操作系统不被恶意程序所破坏），线程在应用层实现有一个优点就是线程切换不用内核介入，线程切换会非常的快。也就是说线程的调度策略是自己实现的。但是这里也有一个巨大的缺陷：由于内核只知道进程而不知道线程，那么进程1中的任何一个线程被阻塞，导致进程1中的其他线程也被阻塞
内核实现线程和用户空间一一对应，可以有效的解决方案一中的缺点，但是由于在内核中实现用户空间相同数量的线程数，开销比较大
用户空间中多个线程映射到内核中的一个线程，这样一来，内核中的线程就不用创建那么多，而且阻塞的概率也降低了，这是一种平衡和折中的方式。JVM就是实现了这种方式 。JVM本身就是一个进程，JVM可以创建很多线程，然后对应内核中的线程，内核中的线程调度CPU。

欢迎关注微信公众号：木可大大，所有文章都将同步在公众号上。