王道操作系统 2.进程与线程

2 进程与线程

2.1 进程与线程

2.1.1 进程的概念和特征

进程的概念

进程是进程实体的运行过程，是系统进行资源分配和调度的一个独立单位。

进程实现操作系统的并发性和共享性。

程序：是静态的，就是个存放在磁盘里的可执行文件，如：QQ.exe。

进程：是动态的，是程序的一次执行过程，或者是一个正在运行的程序，如：可同时启动多次QQ程序。

进程实体：即进程映像，是静态的，可理解为进程的一次时刻的状态。

作业：用户向计算机提交的一项任务，是静态的，它通常是一个批处理程序或一个后台程序。
进程实体的组成
- 程序控制块PCB
  
  PCB是进程存在的唯一标志，当进程被创建时，操作系统为其创建PCB，当进程结束时，会回收其PCB。
  - 进程描述信息
    - 进程标识符PID：当进程被创建时，操作系统会为该进程分配一个唯一的、不重复的“身份证号”–PID（Process ID，进程ID）
    - 用户标识符UID
  - 进程控制和管理信息
    - CPU、磁盘、网络流量使用情况统计…
    - 进程当前状态：就绪态/阻塞态/运行态.…
  - 资源分配清单
    - 正在使用哪些文件
    - 正在使用哪些内存区域
    - 正在使用哪些I/O设备
  - 处理机相关信息（CPU现场信息）：如PSW、PC等等各种寄存器的值（用于实现进程切换）
① PCB，即进程控制块，操作系统需要对各个并发运行的进程进行管理，但凡管理时所需要的信息，都会被放在 PCB 中。
② PCB 是进程存在的唯一标志。
③ PCB 存于内存的内核区，注意内存的内核区和 OS 的内核态的区别，内核程序运行在内核态。
- 程序段：程序的代码（指令序列）
- 数据段：运行过程中产生的各种数据（如：程序中定义的变量）
①PCB 是给操作系统用的，程序段和数据段是给进程自己用的。

②引入进程实体的概念后，可把进程定义为是进程实体的运行过程，是系统进行资源分配和调度的一个独立单位。

还有数据段的堆栈指针
进程的特征

并发进程的「封闭性」指的是程序在执行时独占所有资源，其执行结果不会受到其他程序的影响的特性

如果进程不独占资源（失去封闭性），显然，执行结果会受到其他程序的影响

2.1.2 进程的状态与转换

基本状态
- 运行态。占有CPU，并在CPU上运行；√CPU√其他所需资源
- 就绪态。已具有运行条件，但无空闲CPU，暂时不能运行；×CPU√其他所需资源
  
  系统中处于就绪状态的进程可能有多个，通常将它们排成一个队列，称为就绪队列。
- 阻塞态，又称等待态。因等待某一事件暂时不能运行；×CPU×其他所需资源
  
  系统通常将处于阻塞态的进程也排成一个队列，甚至根据阻塞原因的不同，设置多个阻塞队列。
- 创建态。进程正在被创建，尚未转到就绪态。OS为进程分配系统资源、初始化PCB
  - 首先申请一个空白PCB，并向PCB中填写用于控制和管理进程的信息
  - 然后为该进程分配运行时所必须的资源
  - 最后把该进程转入就绪态并插入就绪队列
  但是，如果进程所需的资源尚不能得到满足，如内存不足，则创建工作尚未完成，进程此时所处的状态称为创建态。
- 终止态。进程正从系统中消失，进程正常结束或其他原因退出运行。OS回收进程拥有的资源，撤销PCB
进程状态的转换

2.1.3 进程的组织方式

链接方式

链接方式是将同一状态的进程的PCB组成一个双向链表，称为进程队列。
- 结构：每个队列的队首和队尾都有一个指针，指向第一个和最后一个PCB。每个PCB中也有两个指针，分别指向前一个和后一个PCB。这样，就可以方便地在队列中插入或删除PCB。
- 优点：简单、灵活
- 缺点：查找效率低，需要遍历链表
索引方式

索引方式是将所有的PCB存放在一张索引表中，每个表项包含一个PCB的地址和状态信息
- 结构：索引表可以是顺序表或散列表，可以按照进程号或其他关键字进行排序或散列
- 优点：查找效率高，可以快速定位到某个PCB
- 缺点：需要额外的空间存储索引表，且索引表的大小受限于内存容量

2.1.4 进程控制

进程控制就是要实现进程状态的转换，通过原语实现

原语在内核态下执行，常驻内存

进程的创建

为新锦成分配所需资源里面有内存空间但是没有CPU，因为CPU是调度算法分配的（可以这么理解，如果创建原语可以分配CPU，那直接就从创建态进入运行态了，而不是就绪态）
- 创建原语：操作系统创建一个进程时使用的原语，其操作如下；创建态→就绪态
  - 申请空白PCB
  - 为新进程分配所需资源
  - 初始化PCB
  - 将PCB插入就绪队列
- 引起进程创建的事件
  - 用户登录：分时系统中，用户登录成功，系统会建立为其建立一个新的进程
  - 作业调度：多道批处理系统中，有新的作业放入内存时，会为其建立一个新的进程
  - 提供服务：用户向操作系统提出某些请求时，会新建一个进程处理该请求
  - 应用请求：由用户进程主动请求创建一个子进程
- 父子进程
  
  允许一个进程创建另一个进程，此时创建者称为父进程，被创建的进程称为子进程。
  - 子进程可以继承父进程所拥有的资源。
  - 当子进程被撤销时，应将其从父进程那里获得的资源归还给父进程。
  - 在撤销父进程时，通常也会同时撤销其所有的子进程。
进程的终止
- 撤销原语：其操作如下；
  
  就绪态/阻塞态/运行态→终止态→无
  - 从PCB集合中找到终止进程的PCB
  - 若进程正在运行，立即剥夺CPU，将CPU分配给其他进程
  - 终止其所有子进程
  - 将该进程拥有的所有资源归还给父进程或操作系统
  - 删除PCB
- 引起进程终止的事件
  - 正常结束：进程自已请求终止（exit系统调用）
  - 异常结束：整数除以0、非法使用特权指令，然后被操作系统强行杀掉
  - 外界干预：Ctrl+Alt+delete，用户选择杀掉进程
进程的阻塞
- 阻塞原语：其操作如下；
  
  运行态→阻塞态
  - 找到要阻塞的进程对应的PCB
  - 保护进程运行现场，将PCB状态信息设置为“阻塞态，暂时停止进程运行
  - 将PCB插入相应事件的等待队列
- 引起进程阻塞的事件
  - 需要等待系统分配某种资源
  - 需要等待相互合作的其他进程完成工作
进程的唤醒
- 唤醒原语：其操作如下；
  
  阻塞态→就绪态
  - 在事件等待队列中找到PCB
  - 将PCB从等待队列移除，设置进程为就绪态
  - 将PCB插入就绪队列，等待被调度
- 引起进程唤醒的事件
  - 等待的事件发生：因何事阻塞，就应由何事唤醒
阻塞原语唤醒原语必须成对使用
进程的切换
- 切换原语：其操作如下；
  
  运行态→就绪态，就绪态→运行态
  - 将运行环境信息存入PCB
  - PCB移入相应队列选择
  - 另一个进程执行，并更新其PCB
  - 根据PCB恢复新进程所需的运行环境
- 引起进程切换的事件
  - 当前进程时间片到
  - 有更高优先级的进程到达
  - 当前进程主动阻塞
  - 当前进程终止

2.1.5 进程的通信

低级通信方式：PV操作。高级通信方式：共享存储、消息传递、管道通信。

共享存储

设置一个共享空间，通过对其进行读/写操作实现信息交换

在对共享空间进行写/读操作时，需要使用同步互斥工具（如PV操作）。

共享存储分为两种：
- 低级方式：基于数据结构的共享
  
  比如共享空间里只能放一个长度为10的数组。这种共享方式速度慢、限制多，是一种低级通信方式
- 高级方式：基于存储区的共享
  
  操作系统在内存中划出一块共享存储区，数据的形式、存放位置都由通信进程控制，而不是操作系统。这种共享方式速度很快，是一种高级通信方式。
进程之间共享空间需要通过特殊的系统调用实现；进程内线程共享进程空间。
消息传递

在消息传递系统中，进程间的数据交换以格式化的消息（Message）为单位。

进程通过操作系统提供的“发送消息/接收消息”两个原语进行数据交换。

在微内核操作系统中，微内核与服务器之间的通信就采用了消息传递机制。

消息格式：
- 消息头：发送进程ID、接受进程ID、消息长度等格式化的信息
- 消息体
通信方式：
- 直接通信方式：发送进程直接把消息发送给接收进程，并将它挂在接收进程的消息缓冲队列上，接收进程从消息缓冲队列中取得消息。
- 间接通信方式：送进程通过信箱间接地通信，将消息发送到某个中间实体，接收进程从中间实体取得消息。该通信方式广泛应用于计算机网络中。
- 注：可以多个进程往同一个信箱 send 消息，也可以多个进程从同一个信箱中 receive 消息。
  
  用发送原语和接收原语实现基于信箱的进程间通信
管道通信

管道是一个特殊的共享文件，又名pipe文件。其实就是在内存中开辟一个大小固定的内存缓冲区。

管道通信允许两个进程按生产者-消费者方式进行通信。各进程要互斥访问管道。
- 写满时，不能再写，读空时，不能再读
- 没写满时，不能读，没读空时，不能写
一个管道只能实现半双工通信；实现双向同时通信要建立两个管道
- 管道本质上是一种特殊的文件。相比于普通的文件通信，其区别如下：
  - 限制管道的大小。管道文件是一个固定大小的缓冲区，使得它的大小不像普通文件那样不加检验地增长。
  - 读进程也可能工作得比写进程快。读空时再读管道会被阻塞，而不是调用返回文件结束。
- 管道中的数据一旦被读出，就彻底消失。因此，当多个进程读同一个管道时，可能会错乱。对此，通常有两种解决方案：
  - ①一个管道允许多个写进程，一个读进程（2014年408真题高教社官方答案）；
  - ②允许有多个写进程，多个读进程，但系统会让各个读进程轮流从管道中读数据（Liux的方案）。
管道只能由创建进程所访问，当父进程创建一个管道后，由于管道是一种特殊文件，子进程会继承父进程的打开文件，因此子进程也继承父进程的管道，并使用它来与父进程进进行通信。

2.1.6 线程和多线程模型

线程的基本概念

线程可理解为轻量级进程，它是一个基本的CPU执行单元，也是程序执行流的最小单位。

线程由线程ID、程序计数器、寄存器集合和堆栈组成。

引入进程的目的是更好地使多道程序并发执行，提高资源利用率和系统吞吐量；

而引入线程的目的则是减小程序在并发执行时所付出的时空开销，提高操作系统的并发性能。

引入线程后，进程只作为除CPU外的系统资源的分配单位，线程则作为处理机（CPU）的分配单元

线程与进程的比较

	传统进程机制	引入线程后
资源分配、调度	进程是资源分配、调度基本单位	进程是资源分配基本单位线程是资源调度基本单位
并发性	进程间并发	线程间也能并发
拥有资源	拥有资源的基本单位	不拥有系统资源
独立性	进程间独立地址空间和资源	同进程下的线程共享地址空间和资源
系统开销	需要切换进程运行环境，开销大	同一进程内线程，不需切换进程环境，开销小
支持多处理机系统	进程只能运行在一个处理机上	进程中多个线程可以分配到多个处理机执行

线程的属性

多线程操作系统中的进程已不再是一个基本的执行实体，但它仍具有与执行相关的状态。所谓进程处于“执行”状态，实际上是指该进程中的某线程正在执行。

注：线程是处理机调度的单位，这里的线程指的是操作系统看得见的内核级线程，内核级线程是处理机分配的单位 。

同进程的线程之间可以共享进程的代码段、全局变量、打开的文件，不共享线程各自的栈指针等TCB内容

线程的实现方式

用户级线程都是线程库实现的，不受操作系统的限制，可以自定义调度函数，线程管理比较灵活，在创建和调度的时候都不需要操作系统来管理

线程的实现可以分为两类：用户级线程和内核级线程。内核级线程又称内核支持的线程。

	用户级线程	内核级线程
线程的管理工作由谁来完成	由应用程序通过线程库实现所有的线程管理工作，包括线程切换	线程管理工作由操作系统内核完成
线程切换是否需要 CPU 变态	用户级线程切换可以在用户态下即可完成，无需操作系统干预	线程调度、切换等工作都由内核负责，因此内核级线程的切换必然需要在核心态下才能完成。
OS 是否能意识到用户级线程的存在	OS 内核意识不到用户级线程的存在用户级线程就是从用户视角看能看到的线程	OS 会为每个内核级线程建立相应的 TCB（线程控制块）通过TCB对线程进行管理内核级线程就是从操作系统内核视角看能看到的线程
优点	用户级线程的切换在用户空间即可完成，不需要切换到核心态，线程管理的系统开销小，效率高	当一个线程被阻塞后，其他线程还可以继续执行，并发能力强多线程可在多核处理机上并行执行
缺点	当一个用户级线程被阻塞后，整个进程都会被阻塞，并发度不高因为进程是处理机调度的基本单位，同一进程的多个线程不可在多核处理机上并行运行	一个用户进程会占用多个内核级线程，线程切换由操作系统内核完成需要切换到核心态，因此线程管理的开销大，效率低，成本高

组合方式

有些系统使用组合方式的多线程实现。在组合实现方式中，内核支持多个内核级线程的建立、调度和管理，同时允许用户程序建立、调度和管理用户级线程。
- 一些内核级线程对应多个用户级线程，这是用户级线程通过时分多路复用内核级线程实现的。
- 同一进程中的多个线程可以同时在多处理机上并行执行，
- 且在阻塞一个线程时不需要将整个进程阻塞，
线程库

线程库是为程序员提供创建和管理线程的API。实现方式有以下两种。
- ①在用户空间中提供一个没有内核支持的库。这种库的所有代码和数据结构都位于用户空间中。这意味着，调用库内的一个函数只导致用户空间中的一个本地函数的调用。
- ②实现由操作系统直接支持的内核级的一个库。对于这种情况，库内的代码和数据结构位于内核空间。调用库中的一个API函数通常会导致对内核的系统调用。

多线程模型
- 一对一模型
  
  一个用户级线程映射到一个内核级线程。每个用户进程有与用户级线程同数量的内核级线程。
  - 优点：当一个线程被阻塞后，别的线程还可以继续执行，并发能力强。多线程可在多核处理机上并行执行。（内核级线程优点）
  - 缺点：一个用户进程会占用多个内核级线程，线程切换由操作系统内核完成，需要切换到核心态，因此线程管理的成本高，开销大。（内核级线程缺点）
- 多对一模型
  
  多个用户级线程映射到一个内核级线程。且一个进程只被分配一个内核级线程。
  - 优点：用户级线程的切换在用户空间即可完成，不需要切换到核心态，线程管理的系统开销小，效率高（用户级线程优点）
  - 缺点：当一个用户级线程被阻塞后，整个进程都会被阻塞，并发度不高。多个线程不可在多核处理机上并行运行（用户级线程缺点）
- 多对多模型
  
  n用户及线程映射到m个内核级线程（n>=m）。每个用户进程对应m个内核级线程。
  
  克服了多对一模型并发度不高的缺点（一个阻塞全体阻塞），又克服了一对一模型中一个用户进程占用太多内核级线程，开销太大的缺点。还拥有上述两种模型各自的优点。
线程的状态与转换
线程的组织与控制
- 线程控制块
  
  与进程类似，系统也为每个线程配置一个线程控制块TCB，用于记录控制和管理线程的信息。线程控制块通常包括
  - ①线程标识符
  - ②一组寄存器，包括程序计数器、状态寄存器和通用寄存器
  - ③线程运行状态，用于描述线程正处于何种状态
  - ④优先级
  - ⑤线程专有存储区，线程切换时用于保存现场等
  - ⑥堆栈指针，用于过程调用时保存局部变量及返回地址等。
  同一进程中的所有线程都完全共享进程的地址空间和全局变量。
  
  各个线程都可以访问进程地址空间的每个单元，所以一个线程可以读、写或甚至清除另一个线程的堆栈。
- 线程的创建
  
  用户程序启动时，通常仅有一个称为“初始化线程”的线程正在执行，其主要功能是用于创建新线程。
  
  在创建新线程时，需要利用一个线程创建函数，并提供相应的参数，如指向线程主程序的入口指针、堆栈的大小、线程优先级等。线程创建函数执行完后，将返回一个线程标识符。
- 线程的终止
  
  当一个线程完成自己的任务后，或线程在运行中出现异常而要被强制终止时，由终止线程调用相应的函数执行终止操作。
  
  但是有些线程（主要是系统线程）一旦被建立，便一直运行而不会被终止。通常，线程被终止后并不立即释放它所占有的资源，只有当进程中的其他线程执行了分离函数后，被终止线程才与资源分离，此时的资源才能被其他线程利用。
  
  被终止但尚未释放资源的线程仍可被其他线程调用，以使被终止线程重新恢复运行。

2.1.7 信号

每个进程都有自己的pending和blocked

每个信号都可以有自己的自定义处理程序

用户进程的配合：比如除以0以后不是让应用闪退而是打印出输入错误这类信息

错题总结：

1.线程包含CPU现场，可以独立执行程序

2.并发进程的运行结果具有不可再现性

3.在单处理器系统中任何时刻都只有一个进程处于运行态（X）所有进程都死锁

4.一个进程在同一时刻不能执行多个程序，只能执行一个程序

5.分时系统中，处于就绪态的进程最多

6.并发进程失去封闭性是指：并发进程共享变量，其执行结果与速度有关

7.进程是资源分配的单位，内核级线程是调度和分派的单位

8.速度最快的进程通信方式：共享内存

9.第27题

10.线程不会增加进程安全性

11.51题A

12.用户级线程切换是咱们自己控制的

13.同一进程的若干线程不能共享某个线程的栈指针

14.管道只允许单向的数据传输

双向传输需要两个管道

15.父子进程不是完全共享父进程虚拟地址空间，只是共享一部分

父子进程共享内容

当通过 fork() 系统调用创建子进程后，为了提高内存使用效率和系统性能，父子进程之间采用了“写时复制”（Copy-On-Write, COW）技术。这意味着最初许多资源是共享的，但当任一进程尝试修改这些资源时，就会为该进程创建一个独立的副本。

资源类别	是否共享	说明与注意事项
代码段	是	只读共享，执行相同的程序代码。
全局变量/数据段	是	初始共享，修改时会为修改方创建副本。
堆内存	是	初始共享，修改时会为修改方创建副本。
栈内存	是	初始共享，修改时会为修改方创建副本。
文件描述符	是	非常重要：子进程继承父进程打开的文件描述符表副本，意味着它们可以操作相同的打开文件、套接字、管道等。
信号处理方式	是	子进程继承父进程对信号的处理设置（如忽略、捕获或默认）。
进程工作目录	是	子进程继承父进程的当前工作目录。
用户/组ID	是	子进程继承父进程的用户ID和组ID。
mmap映射区	是	通过 `mmap` 建立的映射区域（如共享内存）在父子进程间可能是共享的。

父子进程不共享的内容主要包括：

进程标识符：进程ID（PID）、父进程ID（PPID）不同
fork()返回值：父进程返回子进程PID，子进程返回0
运行时间和定时器：如闹钟（alarm）、运行时间计时器等是独立的
未决信号集：已经产生但尚未处理的信号集合是独立的
进程的虚拟地址空间也不是共享的

同一进程下的多线程共享内容

线程是进程内的执行单元，同一进程下的所有线程共享绝大部分的进程资源，这使得线程间通信非常高效，但也带来了严重的线程安全问题，必须使用同步机制（如互斥锁、条件变量等）

对于你的问题：进程 p 创建了线程 T，T 中打开了文件描述符 fd，然后又创建了线程 a 和 b。T, a, b 这三个线程可以共享以下进程 p 的资源：

资源类别	是否共享	说明与注意事项
文件描述符 fd	是	是的。线程 T 打开的文件描述符 `fd`，线程 a 和 b 可以直接使用，因为它们共享进程 p 的文件描述符表。
整个地址空间	是	包括代码段、数据段（全局变量）、堆区。任何线程修改全局变量或堆内存，其他线程立即可见。
信号处理方式	是	所有线程共享对信号的处理设置。
当前工作目录	是	一个线程更改工作目录，其他线程也会受影响。
用户ID和组ID	是	所有线程共享相同的用户和组身份。

每个线程独享的资源主要包括：

线程ID：每个线程有自己的唯一标识符
寄存器状态：包括程序计数器（PC）、栈指针（SP）等，记录线程的执行上下文
栈空间：每个线程拥有独立的栈，用于存储局部变量、函数调用链等。这是最重要的独享资源之一
信号屏蔽字：每个线程可以独立设置要阻塞的信号集合
线程特定数据：可以通过 pthread_key_create等函数为每个线程维护独立的私有数据

2.2 处理机调度

2.2.1 调度的概念

作业是从用户角度出发的，它由用户提交，以用户任务为单位。

进程是从操作系统出发的，由系统生成，是操作系统的资源分配和独立运行的基本单位。

调度的基本概念

处理机调度是对处理机进行分配，即从就绪队列中按照一定的算法（公平、高效的原则）去选择一个进程并将处理机分配给它运行，以实现进程并发地执行。
调度对层次

一个作业从提交开始直到完成，要经历以下三级调度，如下图所示。
- 高级调度（作业调度）
  
  内存空间有限时，无法将用户提交的作业全部放入内存，需要按一定的原则从外存的作业后备队列中挑选一个作业调入内存，并创建进程。
  
  每个作业只调入一次，调出一次。作业调入时会建立PCB，调出时才撤销PCB。
  
  作业：一个具体的任务
  
  多道批处理系统中大多配有作业调度，而其他系统中通常不需要配置作业调度。
  - 发生频率最低外存→内存（面向作业）
- 中级调度（内存调度）
  
  内存不够时，可将某些进程的数据调出外存。等内存空闲或者进程需要运行时，按照某种策略从挂起队列中选择合适的进程重新调入内存。
  
  暂时调到外存等待的进程状态为挂起状态。被挂起的进程PCB会被组织成挂起队列。
  - 外存→内存（面向进程）
- 低级调度（进程调度）
  
  在内存中的按照某种策略从就绪队列中选取一个进程，将处理机分配给它。
  - 发生频率高内存→CPU
三级调度的联系
- 七状态模型
  
  挂起和阻塞的区别： 两种状态都不获得 CPU 服务，但挂起状态将进程调到外存，而阻塞态还在内存中。
- 三层调度对比
三层调度联系

1）作业调度为进程活动做准备，进程调度使进程正常活动起来。

2）中级调度将暂时不能运行的进程挂起，中级调度处于作业调度和进程调度之间。
3）作业调度次数少，中级调度次数略多，进程调度频率最高。
4）进程调度是最基本的，不可或缺。

2.2.2 调度的目标（调度算法的评价指标）

不同的调度算法具有不同的特性，在选择调度算法时，必须考虑算法的特性。评价标准如下。

CPU利用率：指CPU“忙碌”的时间占总时间的比例。
$$
利用率=\frac{忙碌的时间}{总时间}
$$
系统吞吐率：单位时间内完成作业的数量。
$$
系统吞吐率=\frac{总共完成了多少道作业}{总共花了多少时间}
$$
周转时间：指从作业被提交给系统开始，到作业完成为止的这段时间间隔。
$$
周转时间=作业完成时间-作业提交时间
$$
平均周转时间：指多个作业周转时间的平均值。
$$
平均周转时间=\frac{各个作业周转时间之和}{作业数}
$$
带权周转时间：作业周转时间与作业实际运行时间的比值。带权周转时间必然≥1
$$
带权周转时间=\frac{作业周转时间}{作业实际运行时间}=\frac{作业完成时间-作业提交时间}{作业实际运行时间}
$$
平均带权周转时间：多个作业带权周转时间的平均值。
$$
平均带权周转时间=\frac{各个作业带权周转时间之和}{作业数}
$$
等待时间

等待时间，指进程/作业处于等待处理机状态时间之和，等待时间越长，用户满意度越低。
$$
等待时间=周转时间-运行时间
$$
- 对于进程来说，等待时间就是指进程建立后等待被服务的时间之和。
- 对于作业来说，不仅要考虑建立进程后的等待时间，还要加上作业在外存后备队列中等待的时间。
平均等待时间：各个进程/作业等待时间的平均值。
$$
平均等待时间=\frac{各个进程/作业等待时间之和}{进程/作业数}
$$
响应时间：从用户提交请求到首次产生响应所用的时间。

2.2.3 调度的实现

调度程序（调度器）

用于调度和分派CPU 的组件称为调度程序，它通带由三部分组成，如图所示。
- 排队器：将系统中的所有就绪进程按照一定的策略排成一个或多个队列，以便于调度程序选择。每当有一个进程转变为就绪态时，排队器便将它插入到相应的就绪队列中。
- 分派器：依据调度程序所选的进程，将其从就绪队列中取出，将CPU分配给新进程。
- 上下文切换器：在对处理机进行切换时，会发生两对上下文的切换操作：
  - 第一对，将当前进程的上下文保存到其PCB中，再装入分派程序的上下文，以便分派程序运行；
- 第二对，移出分派程序的上下文，将新选进程的CPU现场信息装入处理机的各个相应寄存器。
调度的时机

中断处理结束也可能会导致进程调度的发生（比如时间片轮转的时钟中处理断结束）

临界资源：一个时间段内只允许一个进程使用的资源。各进程需要互斥地访问临界资源。

临界区：访问临界资源的那段代码。

内核程序临界区一般是用来访问某种内核数据结构的，比如进程的就绪队列（由各就绪进程的PCB组成）
进程调度方式
进程切换
- 进程的上下文指进程的代码、数据以及支持进程执行的所有运行环境
- 上下文切换：切换CPU到另一个进程需要保存当前进程状态并恢复另一个进程的状态。
  - 对原来运行进程各种数据的保存
  - 对新的进程各种数据的恢复（如：程序计数器、程序状态字、各种数据寄存器等处理机现场信息，这些信息一保存在进程控制块）
  上下文：某一时刻CPU寄存器和程序计数器的内容。
  
  切换流程：
  - 挂起一个进程，保存CPU上下文，包括程序计数器和其他寄存器。
  - 更新PCB信息。
  - 把进程的PCB移入相应的队列，如就绪、在某事件阻塞等队列。
  - 选择另一个进程执行，并更新其PCB。
  - 跳转到新进程PCB中的程序计数器所指向的位置执行。
  - 恢复处理机上下文。
- 上下文切换的消耗
  
  上下文切换需要消耗大量CPU时间，有些处理器有多个寄存器组，则切换只需改变指针。
  
  进程切换是有代价的，因此如果过于频繁的进行进程调度、切换，必然会使整个系统的效率降低，使系统大部分时间都花在了进程切换上，而真正用于执行进程的时间减少。
- 上下文切换与模式切换
  - 模式切换是用户态和内核态之间的切换，CPU逻辑上可能还在执行同一进程。用户进程最开始都运行在用户态，若进程因中断或异常进入核心态运行，执行完后又回到用户态刚被中断的进程运行。
  - 上下文切换切换了进程，只能发生在内核态，它是多任务操作系统中的一个必需的特性。
同一个进程里面的线程之间的切换，需要执行的操作是更新程序计数器的值，更新栈基址寄存器的值，不需要更新页基址寄存器和打开文件表

更新栈基址寄存器是因为每个线程的栈是独立的，不更新页基址寄存器和打开文件表是因为对于同一个进程的两个线程，这两个东西是共享的

不能进行调度和切换的情况：

1.处理中断的过程中

2.需要完全屏蔽中断的原子操作过程中
闲逛进程

闲逛进程不需要CPU之外的资源，它不会被阻塞。
两种线程的调度
- 用户级线程调度。由于内核并不知道线程的存在，所以内核还是和以前一样，选择一个进程，并给予时间控制。由进程中的调度程序决定哪个线程运行。
- 内核级线程调度。内核选择一个特定线程运行，通常不用考虑该线程属于哪个进程。对被选择的线程赋予一个时间片，如果超过了时间片，就会强制挂起该线程。
用户级线程的线程切换在同一进程中进行，仅需少量的机器指令；

内核级线程的线程切换需要完整的上下文切换、修改内存映像、使高速缓存失效，这就导致了若干数量级的延迟。

2.2.4 典型的调度算法

先来先服务（FCFS）

长作业其实就是占用CPU时间长的作业，其实也就是CPU繁忙型作业，也就是先来先服务利好CPU繁忙型
短作业优先（SJF）

算法思想：追求最少的平均等待时间，最少的平均周转时间、最少的平均平均带权周转时间
算法规则：最短的作业/进程优先得到服务（所谓“最短”，是指要求服务时间最短）
用于作业/进程调度
- 即可用于作业调度，也可用于进程调度。
用于进程调度时为”短进程优先”（SPF，Shortest Process First）
优缺点
- 优点：
  
  “最短的”平均等待时间、平均周转时间；
  - 在所有进程都几乎同时到达时，采用SJF调度算法的平均等待时间、平均周转时间最少；
“抢占式的短作业/进程优先调度算法（最短剩余时间优先，SRNT算法）的平均等待时间、平均周转时间最少”
- 缺点：不公平。对短作业有利，对长作业不利。可能产生饥饿现象。另外，作业进程的运行时间是由用户提供的，并不一定真实，不一定能做到真正的短作业优先。
抢占式的算法；会导致饥饿

SJF和SPF是非抢占式的算法。但是也有抢占式的版本：最剩间优先算法（SRTN，Shortest Remaining Time Next）

 > 每当有进程加入就绪队列改变时就需要调度，如果新到达的进程剩余时间比当前运行的进程剩余时间更短，则由新进程抢占处理机，当前运行进程重新回到就绪队列。另外，当一个进程完成时也需要调度

对短作业有利，占用CPU时间短的作业，其实也就是IO繁忙型作业，也就是短作业优先利好IO繁忙型

高响应比优先（HRRN）

饿的越久，叫的越大声
时间片轮转调度算法（RR）
优先级调度算法
多级队列调度算法
多级反馈队列调度算法

资源利用率高，响应速度快，并发度高排，但是系统开销却很大

	先来先服务	短作业优先	高响应比优先	时间片轮转	多级反馈队列
能否是可抢占	否	能	能	能	队列内算法不一定
能否是非抢占	能	能	能	否	队列内算法不一定
优点	公平，实现简单	平均等待时间最少，效率最高	兼顾长短作业	兼顾长短作业	兼顾长短作业，有较好的的响应时间，可行性强
缺点	不利于短作业	长作业会饥饿，估计时间不易确定	计算响应比的开销大	平均等待时间较长，上下文切换浪费时间	无
适用于	无	作业调度，批处理系统	无	分时系统	相当通用
默认决策模式	非抢占	非抢占	非抢占	抢占	抢占

2.2.5 多处理机调度

错题总结：

1.时间片轮转不能使系统高效，效率不会批处理，但是会让多个用户能够得到及时响应

2.处于临界区的进程在退出临界区前，可以被调度（中断或被抢占）

3.进程上下文不包括中断向量

4.上下文切换不包括主存和外村的数据交换

5.先来先服务利于cpu繁忙型作业，不利于IO繁忙型作业

6.多级反馈队列系统开销较大

7.降低进程优先级一般是进程执行完了以后进行降低

同一进程内的线程切换

同一进程下的线程共享相同的虚拟地址空间和资源（如文件描述符、全局变量等），因此切换时无需更换内存映射环境，主要保存和恢复的是线程的“执行现场”。

触发切换：时间片耗尽、主动让出（如调用pthread_yield()）、等待I/O操作或锁等资源
陷入内核态：CPU 从用户态切换到内核态，以便执行操作系统调度器代码
保存当前线程上下文：将当前线程的“执行现场”保存到其线程控制块（TCB）中。这包括：
- 程序计数器（PC）：保存当前执行位置的下一条指令地址，确保回来时能继续执行
- 通用寄存器：保存AX、BX、CX等寄存器的当前值，这些存放着线程计算中的中间结果
- 栈指针（SP）：保存线程私有栈的当前栈顶位置。每个线程都有自己的栈，用于存储局部变量、函数调用地址等
- 其他架构相关的状态寄存器（如x86的EFLAGS）。
更新当前线程状态：在TCB中将当前线程状态从“运行”改为“就绪”或“阻塞”
选择下一个线程：操作系统调度器根据策略（如时间片轮转、优先级）从就绪队列中选择下一个要运行的线程
加载新线程上下文：从新线程的TCB中加载之前保存的上下文到CPU寄存器
- 恢复PC寄存器，CPU将从这里开始取指执行。
- 恢复通用寄存器的值。
- 恢复栈指针（SP），切换到新线程的私有栈空间。
切换到用户态并恢复执行：CPU从内核态切换回用户态，并开始执行新线程的代码

线程切换不需要修改页表基地址寄存器，因为同属一个进程的线程共享相同的地址空间

进程之间的切换

进程拥有独立的虚拟地址空间和资源。切换时，需要保存和恢复的状态更多，并且必须切换内存映射环境。

触发切换：同样由时间片用完、系统调用、中断等因素触发
陷入内核态
保存当前进程上下文：保存信息到进程控制块（PCB）。除了线程切换中提到的PC、通用寄存器、栈指针（这里指内核栈指针，每个进程有独立的内核栈），还需保存：
- 页表基地址寄存器（如x86的CR3）：这是进程内存映射的“总目录”。
  
  进程切换必须保存旧进程的CR3，并加载新进程的CR3。这会导致TLB（快表）部分或全部失效，可能产生较大开销
- 其他系统资源状态：如打开的文件描述符表、信号处理程序、进程统计信息等
更新当前进程状态：在PCB中更新当前进程状态
选择下一个进程：调度器选择下一个要运行的进程
加载新进程上下文：

从新进程的PCB中加载上下文：
- 恢复PC和通用寄存器。
- 恢复内核栈指针。
- 加载新进程的页表基地址寄存器（CR3），切换地址空间
切换到用户态并恢复执行。

核心差异对比

下表概括了线程切换和进程切换在关键操作上的不同：

操作	同一进程内的线程切换	进程间切换
程序计数器 (PC)	保存与恢复	保存与恢复
栈指针 (SP)	切换（指向线程私有用户栈）	切换（指向进程内核栈；用户栈通过CR3切换间接改变）
通用寄存器	保存与恢复	保存与恢复
页表基址寄存器 (如CR3)	无需切换（共享同一地址空间）	必须切换（进程有独立地址空间）
内存映射 & TLB	TLB通常保持有效，无额外开销	TLB通常需刷新或失效，可能带来较大性能开销
其他资源	共享进程的打开文件、信号处理等，无需切换	需要切换或更新（如文件描述符表等）
总体开销	相对较小，主要在于CPU寄存器保存/恢复和缓存影响	相对较大，主要增加项在于页表切换和TLB失效

2.3 同步与互斥

所有的互斥方法只有记录型信号量和管程实现了让权等待，其他的都是忙等

同一进程的线程，访问进程内的全局变量、静态变量需要互斥访问。

不同进程的线程，访问各自进程的私有资源则不需要互斥访问。不同进程的线程，通过IPC（如共享内存）访问同一块共享资源，就需要互斥访问。

2.3.1 同步与互斥的基本概念

临界资源：一次仅允许一个进程使用的资源
- 类型：物理设备，如打印机等；可被进程共享的许多变量、数据等
- 临界区：访问临界资源的那段代码。
  
  为了保证临界资源的正确使用，可把临界资源的访问过程分成4个部分：
  - 1）进入区。为了进入临界区使用临界资源，在进入区要检查可否进入临界区，若能进入临界区，则应设置正在访问临界区的标志，以阻止其他进程同时进入临界区。
  - 2）临界区。进程中访问临界资源的那段代码，又称临界段。
  - 3）退出区。将正在访问临界区的标志清除。
  - 4）剩余区。代码中的其余部分。
  1
  2
  3
  4
  5
  6
  do{
  entry section; //进入区
  critical section; //临界区
  exit section; //退出区
  remainder section; //剩余区
  }while(true)
同步
- 同步亦称直接制约关系，它是指为完成某种任务而建立的两个或多个进程，这些进程因为需要在某些位置上协调它们的工作次序而产生的制约关系。进程间的直接制约关系就是源于它们之间的相互合作。
- 读进程和写进程并发地运行，由于并发必然导致异步性，因此“写数据”和“读数据”两个操作执行的先后顺序是不确定的。而实际应用中，又必须按照“写数据→读数据”的顺序来执行的。
如何解决这种异步问题，就是“进程同步”所讨论的内容。
互斥

互斥也称间接制约关系。当一个进程进入临界区使用临界资源，另一进程必须等待当占用临界资源的进程退出临界区后，另一进程才能访问此临界资源。

遵循原则：
- 空闲让进。临界区空闲时，可以允许一个请求进入临界区的进程立即进入临界区；
- 忙则等待。当已有进程进入临界区时，其他图进入临界区进必须等待
- 有限等待。对请求访问的进程，应保证能在有限时间内进入临界区（保证不会饥饿）
- 让权等待。当进程不能进入临界区时，应立即释放处理机，防止进程忙等待。

2.3.2 实现临界区互斥的基本方法

所有方法都没能解决让权等待

软件实现方法

单标志法（违背“空闲让进”原则）

两个进程在访问完临界区后会把使用临界区的权限转交给另一个进程。也就是说每个进程进入临界区的权限只能被另一个进程赋予。

该算法设置一个公用整型变量turn，用于指示被允许进入临界区的进程编号。

若某个进程不再进入临界区，则另一个进程也将无法进入临界区（违背”空闲让进”）。
双标志法先检查（违背“忙则等待”原则）

在每一个进程访问临界区资源之前，先查看一下临界区资源是否正被访问，若正被访问，该进程需等待：否则，进程才进入自己自己的临界区。

设置一个布尔型数组flag[ ]，数组中各个元素用来标记各进程想进入临界区的意愿，比如“flag[0]=ture”意味着0号进程P0现在想要进入临界区。每个进程在进入临界区之前先检查当前有没有别的进程想进入临界区，如果没有，则把自身对应的标志flag设为true，之后开始访问临界区。
- 优点：不用交替进入，可连续使用
- 缺点：按序列①⑤②⑥执行时，会同时进入临界区（违背“忙则等待”），Pi进程和Pj进程可能同时进入临界区；检查和修改操作不能一次进行。
双标志法后检查

双标志先检查法的改版。前一个算法的问题是先“检查”后“上锁”，但是这两个操作又无法一气呵成，因此导致了两个进程同时进入临界区的问题。因此，人们又想到先“上锁”后“检查”的方法，来避免上述问题。
- 缺点：当两个进程几乎同时都想进入临界区时，它们分别将自己的标志值设置为TRUE，并且同时检测对方的状态，发现对方也要进入临界区，于是双方互相谦让，结果谁也进不了临界区，从而导致“饥饿”现象。违背了“空闲让进”和“有限等待”产生饥饿
Peterson算法

结合双标志法、单标志法的思想。如果双方都争着想进入临界区，那可以让进程尝试“孔融让梨”（谦让）。做一个有礼貌的进程。
- 为了防止两个进程为进入临界区而无限期等待，又设置了变量turn，每个进程在先设置自己的标志后再设置turn标志。这时，再同时检测另一个进程状态标志和允许进入标志，以便保证两个进程同时要求进入临界区时，只允许一个进程进入临界区。
- 进程在进入区要做的步骤： ① 主动争取 ② 主动谦让 ③ 检查对方是否也想使用，且最后一次是不是自己说了客气话
- 存在问题：Peterson 算法用软件方法解决了进程互斥问题，遵循 “空闲让进”、“忙则等待”、“有限等待” 三个原则，但是依然未遵循 “让权等待” 的原则。

软件方法总结

	单标志法	双标志先检查	双标志后检查	Peterson 算法
算法	在进入区只做“检查”，不”上锁“ 在退出区把临界区的使用权转交给另一个进程 (相当于在退出区既给另一进程”解锁”，又给自己”上锁”）	在进入区先”检查”后”上锁”，退出区”解锁“	在进入区先”加锁”后”检查”，退出区”解锁”	在进入区”主动争取一主动谦让一检查对方是否想进、已方是否谦让“
问题	不遵循”空闲让进”	不遵循”忙则等待”	不遵循”空闲让进、有限等待”，可能导致”饥饿”	不遵循”让权等待”，会发生”忙等”

硬件实现方法

中断屏蔽方法

当一个进程正在使用处理机执行它的临界区代码时，要防止其他进程再进入其临界区访问的最简单的方法是：禁止一切中断发生，或称之为屏蔽中断、关中断。
- 优点：简单、高效
- 缺点：不适用于多处理机；只适用于操作系统内核进程，不适用于用户进程（因为开/关中断指令只能运行在内核态，这组指令如果能让用户随意使用会很危险）
不适用于多处理机，因为你当前处理机如果关中断，但是另外一个处理机还是可以访问临界区，达不到互斥的效果
硬件指令法
- TestAndSet指令
  
  简称TS指令，也有地方称为TestAndSetLock指令，或TSL指令TSL指令是用硬件实现的。TS是原子操作，执行的过程不允许被中断，只能一气呵成。以下是用C语言描述的逻辑。
  
  相比软件实现方法，TSL 指令把上锁和检查操作用硬件的方式变成了一气呵成的原子操作。
  - 优点： 实现简单，无需像软件实现方法那样严格检查是否会有逻辑漏洞。适用于多处理机环境。
  - 缺点： 不满足 “让权等待” 原则，暂时无法进入临界区的进程会占用CPU并循环执行TSL指令，从而导致忙等。
- Swap指令
  
  有的地方也叫Exchange指令，或简称XCHG指令。Swp指令是用硬件实现的，是原子操作，执行的过程不允许被中断，只能一气呵成。
逻辑上来看 Swap 和 TSL 并无太大区别，都是先记录下此时临界区是否已经被上锁（记录在 old 变量上），再将上锁标记 lock 设置为 true，最后检查 old，如果 old 为 false 则说明之前没有别的进程对临界区上锁，则可跳出循环，进入临界区。Swap 指令优点缺点和TSL指令相同。
- 硬件指令方法的优点
  - 适用于任意数目的进程，不管是单处理机还是多处理机；简单、容易验证其正确性。
  - 可以支持进程内有多个临界区，只需为每个临界区设立一个布尔变量。
- 硬件指令方法的缺点
  - 进程等待进入临界区时要耗费处理时间，不能实现让权等待。
  - 从等待进程中随机选择一个进入临界区，有进程可能一直选不上，从而导致“饥饿”现象。

2.3.3 互斥锁

解决临界区最简单的工具就是互斥锁（mutex lock）。一个进程在进入临界区时获得锁；在退出临界区时释放锁。函数acquire()获得锁，而函数release()释放锁。acquire()和release()是原子操作，由硬件机制完成。

每个互斥锁有一个布尔变量available，表示锁是否可用。如果锁是可用的，调用acquire()会成功，且锁不再可用。当一个进程试图获取不可用的锁时，会被阻塞，直到锁被释放。

acquire(){
    while(!available);		//忙等待
    avilable = false;		//获得锁
}
release(){
    available = true;		//释放锁
}

优点：等待期间不用切换进程上下文，多处理器系统中，若上锁的时间短，则等待代价很低
缺点：需忙等，进程时间片用完才下处理机，违反“让权等待”；不太适用于单处理机系统，忙等的过程中不可能解锁

2.3.4 信号量

PV操作是一种低级通信原语，不能被中断的

信号量机制是一种功能较强的机制,可用来解决互斥与同步问题，它只能被两个标准的原语wait(S)和signal(S)访问，也可记为”P操作”和”V操作”。

信号量其实就是一个变量（可以是一个整数，也可以是更复杂的记录型变量），可以用一个信号量来表示系统中某种资源的数量，比如：系统中只有一台打印机，就可以设置一个初值为1的信号量。

原语是一种特殊的程序段，其执行只能一气呵成，不可被中断。原语是由关中断/开中断指令实现的。软件解决方案的主要问题是由“进入区的各种操作无法一气呵成”，因此如果能把进入区、退出区的操作都用“原语”实现，使这些操作能“一气呵成”就能避免问题。

整型信号量

用一个整数型的变量作为信号量，用来表示系统中某种资源的数量。wait(S)、signal(S)可描述为：

与普通整数变量的区别：对信号量的操作只有三种，即初始化、P操作、V操作

wait(S) 原语，“检查”和“上锁”一气呵成，避免了并发、异步导致的问题。以申请使用打印机举例：

存在的问题： 不满足 “让权等待” 原则，会发生忙等。
记录型信号量

整型信号量存在“忙等”问题，因此人们又提出了“记录型信号量”，即用记录型数据结构表示的信号量。

除了需要用于代表资源数目的整型变量value外，再增加一个进程链表L，用于链接所有等待该资源的进程。
- wait：如果剩余资源数不够使用block原语使进程从运行态进入阻塞态，并把挂到信号量S的等待队列（即阻塞队列）中。
- signal：释放资源后，若还有别的进程在等待这种资源，则使用wakeup原语唤醒等待队列中的一个进程，该进程从阻塞态变为就绪态。
- S.value的初值表示系统中某种资源的数目。
- P操作：
  - 对信号量S的一次P操作意味着进程请求一个单位的该资源，因此需要执行S.value-，表示资源数减1
  - 当S.value<0时表示该类资源已分配完毕，因此进程应调用bock原语进行自我阻塞（当前运行的进程从运行态→阻塞态），主动放弃处理机，并插入该类资源的等待队列S.L中。
  - 可见，该机制遵循了“让权等待”原则，不会出现“忙等”现象。
- V操作：
  
  对信号量S的一次V操作意味进程释放一个单位的该资源，因此需要执行S.value.+，表示资源数加1，
  - 若加1后仍是S.value<=0，表示依然有进程在等待该类资源，因此应调用wakeup原语唤醒等待队列中的第一个进程（被唤醒进程从阻塞态→就绪态）
例：某计算机系统中有1台打印机，则可在初始化信号量 S 时将 S.value 的值设为 1，队列 S.L 设置为空。

① CPU 为 P0 服务，S.value –，值为 0，P0开始使用打印机。
② CPU 为 P1 服务，S.value –，值为 -1，无资源执行 block 原语( wait原语 )。阻塞队列( P1 )，S.value = -1 说明有1个进程在等待资源。
③ CPU 为 P2 服务，S.value –，值为 -2，无资源执行 block 原语。阻塞队列( P1→P2 )，S.value = -2 说明有2个进程在等待资源。
④ CPU 为 P0 服务，S.value ++，S.value = -1 ≤ 0，说明有进程在等待该资源。因此应调用 wakeup 原语(signal原语)唤醒等待队列中的第一个进程P1，将释放资源给 P1，P1从阻塞态变为就绪态，等待被 CPU 服务(CPU顺序执行)。阻塞队列( P2 )
⑤ CPU 为 P1 服务，P1 使用完打印机，S.value ++，S.value = 0，调用 wakeup 原语唤醒 P2。阻塞队列()。
⑥ CPU 为 P2 服务， P2是用完打印机，S.value ++，S.value = 1。
信号量机制实现进程互斥
- 伪代码如下所示：
  
  设 S 为实现进程 P1、P2 互斥的信号量，由于只允许一个进程进入临界区，所以 S 的初值应设为 1。然后把临界区置于 P(S) 和 V(S) 之间，进入区之前申请资源（P操作），退出区之前释放资源（ V操作），即可实现两个进程对临界资源的互斥访问。
- 操作：
  - 1.分析并发进程的关键活动，划定临界区（如：对临界资源打印机的访问就应放在临界区）
  - 2.设置互斥信号量mutex，初值为1
  - 3.在进入区P（mutex）一一申请资源
  - 4.在退出区V（mutex）一一释放资源
- 注意
  - 对不同的临界资源需要设置不同的互斥信号量。
  - P、V操作必须成对出现。缺少P（mutex）就不能保证临界资源的互斥访问。缺少V（mutex）会导致资源永不被释放，等待进程永不被唤醒。
信号量机制实现进程同步

进程同步要让各并发进程按要求有序地推进。
- 程序保证了代码4一定是在代码2之后执行。
- 步骤：先V后P，后V前P
  - 1.分析什么地方需要实现“同步关系”，即必须保证“一前一后”执行的两个操作（或两句代码）
  - 2.设置同步信号量S，初始为0
  - 3.在“前操作”之后执行V（S）
  - 4.在“后操作”之前执行P（S）
- 注意
  - 若先执行到V(S)操作，则S+后S=1。之后当执行到P(S)操作时，由于S=1，表示有可用资源，会执行S-，S的值变回0，P2进程不会执行block原语，而是继续往下执行代码4。
  - 若先执行到P(S)操作，由于S=0，S-后S=-1，表示此时没有可用资源，因此P操作中会执行bock原语，主动请求阻塞；当执行完代码2，继而执行V(S)操作，S+，使S变回0，由于此时有进程在该信号量对应的阻塞队列中，因此会在V操作中执行wakeup原语，唤醒P2进程。这样P2就可以继续执行代码4
信号量机制实现前驱关系

分析问题，画出前驱图，把每一对前驱关系都看成一个同步问题
- 问题：下图是一个前驱图，其中 S1, S2, S3, … ,S6 是进程 P1, P2, P3,…, P6 中的程序段，这些程序段要求按如下前驱图所示的顺序来执行：
- 操作：
  - 1.要为每一对前驱关系各设置一个同步信号量
  - 2.在“前操作”之后对相应的同步信号量执行V操作
  - 3.在“后操作”之前对相应的同步信号量执行P操作
同步、互斥信号量总结

注：互斥信号量初值一般为1，同步信号量的初始值要看对应资源的初始值是多少。

2.3.5 管程

管程是被进程调用的，管程是语法范围，无法创建和撤销

引入管程原因

管程的引入让程序员写程序时不需要再关注复杂的PV操作，从而避免了传统信号量机制存在的很多问题。
定义：由一组数据及定义在这组数据之上的对这组数据的操作组成的软件模块，这组操作能初始化并改变管程中的数据和同步进程。

管程的组成

局部于管程的共享数据结构说明
对该数据结构进行操作的一组过程（函数）
对局部于管程的共享数据设置初始值的语句
管程的名字

monitor Demo{//定义一个名称为"Demo"的管程
    //定义共享数据结构，对应系统中的某种共享资源
    共享数据结构 S;
    //对共享数据结构初始化的语句
    init_code(){
        S=5;		//初始资源数等于5
    }
    //过程1：申请一个资源
    take_away(){
        对共享数据结构x的一系列处理;
        s--;		//可用资源-1
        ...
    }
    //过程2：归还一个资源
    give_back(){
        对共享数据结构x的一系列处理;
        s++;		//可用资源+1
        ...
    }
}

管程的基本特征

局部于管程的数据只能被局部于管程的过程所访问
一个进程只有通过调用管程内的过程才能进入管程访问共享数据
每次仅允许一个进程在管程内执行某个内部过程

注：过程其实就是函数，如下面这个 People 类，People 是管程的名字，username 和 str 是局部于管程的共享数据结构，login 方法是该数据结构进行操作的过程。
1
2
3
4
5
6
7
8
9
10
public class People{
	private String username = "admin"; // 用户名
	private String str= "123456"; // 密码

	public void login(){
		if("admin".equals(username) && "123456".equals(str)){
			System.out.println("登录成功！");	
		}
	}
}

条件变量

条件变量condition，是表示管程阻塞原因的变量。

通常，一个进程被阻塞的原因可以有多个，因此在管程中设置了多个条件变量。每个条件变量保存了一个等待队列，用于记录因该条件变量而阻塞的所有进程，对条件变量只能进行两种操作，即wait和signal。

x.wait：当x对应的条件不满足时，正在调用管程的进程调用x.wait将自己插入x条件的等待队列，并释放管程。此时其他进程可以使用该管程。
x.signal：x对应的条件发生了变化，则调用x.signal，唤醒一个因x条件而阻塞的进程。
理解 x.wait() 的具体步骤
当线程在管程中调用 x.wait() 时，会发生以下一系列操作
1. 释放管程锁：线程立即释放管程的互斥锁（mutex）。这一步至关重要，使得其他线程能够进入管程执行，从而可能改变条件并发出通知，避免了死锁。
2. 阻塞并加入队列：该线程被阻塞，并放入条件变量 x 专用的等待队列中（注意，这与管程的入口等待队列不同
3. 等待唤醒：该线程在此挂起，等待其他线程调用 x.signal()（或 x.notify()）来唤醒它。
当某个线程在管程中调用 x.signal() 时
- 如果条件变量 x 的等待队列中有正在等待的线程，则会唤醒其中一个（具体唤醒哪一个取决于调度策略，如FIFO或优先级）。
- 如果 x的等待队列中没有等待线程，那么这个signal调用就相当于空操作，不会被记录或“积累”

**总结：**wait可不管你的S大于0还是小于0，只要你调用wait，我就把你挂到阻塞队列，不调用signal就醒不来。而S<0是咱们自己加的，是咱们要让这个情况下的进程阻塞，才会在S<0的时候调用wait

monitor Demo{
    共享数据结构 S;
    condition x；					//定义一个条件变量x
    init_code(){...}
    take_away(){
        if(S<0) x.wait();			//资源不够，在条件变量x上阻塞等待
        资源足够，分配资源，做一系列处理；
    }
    give_back(){
        归还资源，做一系列相应处理;
		if(有进程在等待）x.signal();	//唤醒一个阻塞进程
    }
}

条件变量和信号量的比较：
- 相似点：条件变量的wait/signal操作类似于信号量的P/V操作，可以实现进程的阻塞/唤醒。
- 不同点：条件变量是“没有值”的，仅实现了“排队等待”功能；而信号量是“有值”的，信号量的值反映了剩余资源数，而在管程中，剩余资源数用共享数据结构记录。
- 管程中的条件变量 x 是一个睡眠等待点。x.wait() 意味着“我认为我现在等待的条件不满足，所以我主动睡到x的床上，并放开锁让别人干活”；而 x.signal() 就像是“我发现条件可能变化了，叫醒一个在x床上睡觉的人，让它起来再看看情况”。条件本身是否成立，需要线程自己用while循环来检查和判断。就比如上面的S<0，然后去执行wait。

2.3.6 经典同步问题

生产者-消费者问题

问题描述

系统中有一组生产者进程和一组消费者进程，生产者进程每次生产一个产品放入缓冲区，消费者进程每次从缓冲区中取出一个产品并使用。（注：这里的“产品”理解为某种数据）

生产者、消费者共享一个初始为空、大小为n的缓冲区。
- 只有缓冲区没满时，生产者才能把产品放入缓冲区，否则必须等待。
- 只有缓冲区不空时，消费者才能从中取出产品，否则必须等待。
缓冲区是临界资源，各进程必须互斥地访问。

问题分析

1.关系分析。找出题目中描述的各个进程，分析它们之间的同步、互斥关系。

同步关系：缓冲区没满，生产者生产；缓冲区没空，消费者消费。

互斥关系：各进程互斥访问缓冲区。
2.整理思路。根据各进程的操作流程确定P、V操作的大致顺序。
3.设置信号量。并根据题目条件确定信号量初值。（互斥信号量初值一般为1，同步信号量的初始值要看对应资源的初始值是多少）

1
2
3

semaphore mutex = 1; //互斥信号量，实现对缓冲区的互斥访问
semaphore empty = n; //同步信号量，表示空闲缓冲区的数量
semaphore full = 0;  //同步信号量，表示产品的数量，也即非空缓冲区的数量

进程描述
能否改变相邻P、V操作的顺序？

不能，会发生死锁

V 操作不会导致进程阻塞，因此两个 V 操作顺序可以交换。
能否只设置一个同步信号量

不能。原因在于：两个信号量 empty 和 full，其中 empty 用于制约生产者生产，full 用于制约消费者消费。如果只设置一个信号量，如 full，那么生产者会无限的生产，起不到制约作用。

多生产者多消费者问题

问题描述

桌子上有一只盘子，每次只能向其中放入一个水果。爸爸专向盘子中放苹果，妈妈专向盘子中放橘子，儿子专等着吃盘子中的橘子，女儿专等着吃盘子中的苹果。只有盘子空时，爸爸或妈妈才可向盘子中放一个水果。仅当盘子中有自己需要的水果时，儿子或女儿可以从盘子中取出水果。

问题分析

1.关系分析

同步关系：① 父亲将苹果放入盘子，女儿才能取苹果；
② 母亲将句子放入盘子，儿子才能取橘子；
③ 只有盘子为空，父亲或者母亲才能放水果。
互斥关系：对缓冲区(盘子)的访问要互斥的进行。
2.整理思路

注：盘子为空这个事件可由儿子或者女儿触发，发生后父亲或母亲才可放水果。
分析同步要以事件的角度分析，不要以进程的角度分析。

3.信号量的设置

semaphore mutex = 1;  //实现互斥访问盘子（缓冲区）
semaphore apple = 0;  //盘子中有几个苹
semaphore orange = 0; //盘子中有几个橘子
semaphore plate = 1;  //盘子中还可以放多少个水果

进程描述

先把同步信号量都给写好，再写互斥信号量
能否不用互斥信号量

如果缓冲区大小为1，在任何时刻，apple、orange、plate 三个信号量中最多只有一个是1。因此在任何时刻，最多只有一个进程的P操作不会被阻塞，并顺利地进入临界区。
如果缓冲区大小大于1，数据可能存在相互覆盖的情况。如：父亲在向盘子放橘子的同时，母亲也可以往盘子里放橘子，有可能导致两个进程写入缓冲区的数据相互覆盖的情况。
因此，当缓冲区大小等于1，有可能不设置互斥变量。当缓冲区大小大于1，必须设置互斥变量。是否不用设置互斥信号量主要观察，同一时刻信号量是否最多一个1，建议设置互斥信号量。

但需要注意的是，实现互斥的P操作一定要在实现同步的P操作之后，否则可能引起“死锁”。
分析

在分析同步问题（一前一后问题）的时候不能从单个进程行为的角度来分析，要把“一前一后”发生的事看做是两种“事件”的前后关系。

如果从单个进程的角度来考虑的话，会有以下结论：
- ① 如果盘子里装有苹果，那么一定要女儿取走苹果后父亲或母亲才能再放入水果；
- ② 如果盘子里装有橘子，那么一定要儿子取走橘子后父亲或母亲才能再放入水果。
这就意味着要设置四个同步信号量分别实现这四个一前一后的关系，较为复杂。

若从事件的角度来考虑，我们可以把上述四对进程行为的前后关系抽象为一对事件的前后关系，即：盘子变空事件 → 放入水果事件。

读者-写者问题
- 问题描述
  
  有读者和写者两组并发进程，共享一个文件，当两个或两个以上的读进程同时访问共享数据时不会产生副作用，但若某个写进程和其他进程（读进程或写进程）同时访问共享数据时则可能导致数据不一致的错误。因此要求：
  - ①允许多个读者可以同时对文件执行读操作
  - ②只允许一个写者往文件中写信息
  - ③任一写者在完成写操作之前不允许其他读者或写者工作
  - ④写者执行写操作前，应让已有的读者和写者全部退出
- 问题分析
  - 两类进程：写进程、读进程
  - 互斥关系：写进程一写进程、写进程一读进程。读进程与读进程不存在互斥问题
- 进程描述
  - 方案1
    
    方案设置 rw 和 mutex 两个信号量。rw 信号量用于实现读进程与写进程、写进程与写进程对共享文件的互斥访问。mutex 信号量用于保证对 count 变量的互斥访问。
    
    若没有设置 mutex 信号量，两个读进程并发执行到 if 条件且都满足，都会执行 P(rw)，会造成其中一个读进程阻塞的情况。设置 mutex 信号量，使得 count 信号量的检查和赋值操作一气呵成，保证了对 count 信号量访问的互斥性。
    
    方案 1 存在的问题： 只要有读进程还在读，写进程就要一直阻塞等待，可能 “饿死”。因此，这种算法中，读进程是优先的。
  - 方案2
    
    方案 2 是对方案 1 问题的修正，添加了 w 信号量，保证了读写公平。如：假设对共享文件的访问顺序是：读者1→读者2→ 写者1 → 读者3 ，读者 2 执行完后，写者 1 将会进行写文件，读者 3 进程将会被阻塞。待写者1写完文件后，读者 3 进行读写者 1 访问后的文件。
    
    算法核心思想在于设置了一个计数器 count 用来记录当前正在访问共享文件的读进程数。我们可以用 count 的值来判断当前进入的进程是否是第一个/最后一个读进程，从而做出不同的处理。另外，还需考虑 count 变量的互斥性。
- 结论
  
  在这种算法中，连续进入的多个读者可以同时读文件；写者和其他进程不能同时访问文件；写者不会饥饿，但也并不是真正的“写优先”，而是相对公平的先来先服务原则。
  
  有的书上把这种算法称为“读写公平法”
哲学家进餐问题
- 问题描述
  
  一张圆桌上坐着5名哲学家，每两个哲学家之间的桌上摆一根筷子，桌子的中间是一碗米饭。哲学家们倾注毕生的精力用于思考和进餐，哲学家在思考时，并不影响他人。只有当哲学家饥饿时，才试图拿起左、右两根筷子（一根一根地拿起）。如果筷子已在他人手上，则需等待。饥饿的哲学家只有同时拿起两根筷子才可以开始进餐，当进餐完毕后，放下筷子继续思考。
- 问题分析
  - 1.关系分析
    
    系统中有5个哲学家进程，5位哲学家与左右邻居对其中间筷子的访问是互斥关系。
  - 2.整理思路
    
    哲学家进餐问题中只有互斥关系，但与之前遇到的问题不同点在于，每个哲学家进程需要同时持有两个临界资源才能开始吃饭。如何避免临界资源分配不当造成的死锁现象，是哲学家问题的关键。
  - 3.信号量的设置
    
    定义互斥信号量数组 chopstick[5]={1,1,1,1,1} 用于实现对 5 个筷子的互斥访问。并对哲学家按0~4编号，哲学家 i 左边的筷子编号为 i，右边的筷子编号为 (i+1)%5。此外，还需要设置互斥信号量mutex，用以保证哲学家进程左右两支筷子都可用。
- 如何防止死锁？
- 方案三进程描述
  
  算法保证，一个哲学家再拿到筷子拿到一半时被阻塞，也不会有别的哲学家尝试拿筷子，即至少有一个哲学家进程不阻塞。

吸烟者问题（考纲没有，自己看看）

问题描述

假设一个系统有三个抽烟者进程和一个供应者进程。每个抽烟者不停地卷烟并抽掉它，但是要卷起并抽掉一支烟，抽烟者需要有三种材料：烟草、纸和胶水。三个抽烟者中，第一个拥有烟草、第二个拥有纸、第三个拥有胶水。供应者进程无限地提供三种材料，供应者每次将两种材料放桌子上，拥有剩下那种材料的抽烟者卷一根烟并抽掉它，并给供应者进程一个信号告诉完成了，供应者就会放另外两种材料在桌上，这个过程一直重复（让三个抽烟者轮流地抽烟）。

问题分析

1.关系分析

同步关系：① 桌上有组合一，第一个抽烟者取走东西
② 桌上有组合二，第二个抽烟者取走东西
③ 桌上有组合三，第三个抽烟者取走东西
④ 抽烟者抽完发出完成信号，供应者将下一个组合放到桌上
互斥关系：对缓冲区的访问要互斥的进行。
2.整理思路

注：由于缓冲区大小为1，任意时刻同步信号量和互斥信号量最多只有一个1，因此互斥信号量可以不设置。

3.信号量的设置

semaphore offer1 = 0; //桌上组合一的数量
semaphore offer2 = 0; //桌上组合二的数量
semaphore offer3 = 0; //桌上组合三的数量
semaphore finish = 0; //抽烟是否完成
int i = 0; //用于实现“三个抽烟者轮流抽烟”

进程描述
能否从进程角度思考？

不可以。
同多生产者多消费者问题，假设从进程角度思考，那么第一个抽烟者抽完后，供应者再将第一个组合放到桌上；第二个抽烟者抽完后，供应者再将第二个组合放到桌上；第三个抽烟者抽完后，供应者再将第三个组合放到桌上。这样相比于从事件考虑的一个一前一后的关系，多出了多个关系，并且较为复杂。因此要从事件的角度思考 PV 关系。

2.4 死锁

2.4.1 死锁的概念

死锁的定义

在并发环境下，各进程因竞争资源而造成的一种互相等待对方手里的资源，导致各进程都阻塞，都无法向前推进的现象，就是“死锁”。发生死锁后若无外力干涉这些进程都将无法向前推进。
死锁、饥饿、死循环的区别
- 共同点：都是进程无法顺利向前推进的现象（故意设计的死循环除外)
- 区别：
  - 死锁：各进程互相等待对方手里的资源，导致各进程都阻塞，无法向前推进的现象。两个以上程序
  - 饥饿：由于长期得不到想要的资源，某进程无法向前推进的现象。单个程序
    
    比如：在短进程优先（SPF）算法中，若有源源不断的短进程到来，则长进程将一直得不到处理机，从而发生长进程“饥饿”
  - 死循环：某进程执行过程中一直跳不出某个循环的现象。
    
    有时是因为程序逻辑bug导致的，有时是程序员故意设计的。
死锁产生原因
- 对系统资源的竞争
  
  各进程对不可剥夺的资源（如打印机）的竞争可能引起死锁，对可剥夺的资源（CPU）的竞争是不会引起死锁的。
- 进程推进顺序非法
  
  请求和释放资源的顺序不当，也同样会导致死锁。例如，并发执行的进程P1、P2分别申请并占有了资源R1、R2，之后进程P1又紧接着申请资源R2，而进程P2又申请资源R1，两者会因为申请的资源被对方占有而阻塞，从而发生死锁。
- 信号量的使用不当也会造成死锁
  
  如生产者-消费者问题中，如果实现互斥的P操柞在实现同步的P操作之前，就有可能导致死锁。（可以把互斥信号量、同步信号量也看做是一种抽象的系统资源）
死锁产生的必要条件

产生死锁必须同时满足以下四个条件，只要其中任一条件不成立，死锁就不会发生。
- ① 互斥条件：只有对必须互斥使用的资源的争抢才会导致死锁（如哲学家的筷子、打印机设备）。像内存、扬声器这样可以同时让多个进程使用的资源是不会导致死锁的（因为进程不用阻塞等待这种资源）。
- ② 不剥夺条件：进程所获得的资源在未使用完之前，不能由其他进程强行夺走，只能主动释放。
- ③ 请求和保持条件：进程已经保持了至少一个资源，但又提出了新的资源请求，而该资源又被其他进程占有，此时请求进程被阻塞，但又对自己已有的资源保持不放。
- ④ 循环等待条件：存在一种进程资源的循环等待链，链中的每一个进程已获得的资源同时被下一个进程所请求。
注：发生死锁时一定有循环等待，但是发生循环等待时未必死锁，即循环等待是死锁的必要不充分条件。

如果同类资源数大于1，则即使有循环等待，也未必发生死锁（如上图 Pn 可以同时请求 P1 或者 Pk 的资源，得到 Pk 资源后，不会发生死锁）。 但如果系统中每类资源都只有一个，那循环等待就是死锁的充分必要条件了。

死锁处理策略

死锁预防。设置某些限制条件，破坏产生死锁的4个必要条件中的一个或几个。
避免死锁。在资源的动态分配过程中，用某种方法防止系统进入不安全状态。
死锁的检测及解除。无须采取任何限制性措施，允许进程在运行过程中发生死锁。通过系统的检测机构及时地检测出死锁的发生，然后采取某种措施解除死锁。

死锁的几种处理策略的比较见下表。

	资源分配策略	各种可能模式	主要优点	主要缺点
死锁预防	保守，宁可资源闲置	一次请求所有资源，资源剥夺，资源按序分配	适用于突发式处理的进程，不必进行剥夺	效率低，进程初始化时间延长；剥夺次数过多；不便灵活申请新资源
死锁避免	是“预防”和“检测”的折中（在运行时判断是否可能死锁）	寻找可能的安全允许顺序	不必进行剥夺	必须知道将来的资源需求；进程不能被长时间阻塞
死锁检测	宽松，只要允许就分配资源	定期检查死锁是否已经发生	不延长进程初始化时间，允许对死锁进行现场处理	通过剥夺解除死锁，造成损失

2.4.2 死锁预防

死锁的产生必须满足四个必要条件，只要其中一个或者几个条件不满足，死锁不会发生。

破坏互斥条件
破坏不剥夺条件
破坏请求和保持条件
破坏循环等待条件

2.4.3 死锁避免

死锁的避免是在资源动态分配过程中，防止系统进入不安全状态，以避免发生死锁。

仅仅是一种可能的分配资源的方案，而不是必须遵守的规定

该算法不会给可能导致死锁的进程分配资源

系统安全状态
- 安全序列：是指如果系统按照这种序列分配资源，则每个进程都能顺利完成。
- 安全状态：系统如果存在安全序列，则处于安全状态，安全状态一定不发生死锁。安全序列可能有多个。
- 不安全状态：如果分配了资源之后，系统中找不出任何一个安全序列，系统就进入了不安全状态。可能发生死锁（处于不安全状态未必就是发生了死锁，但发生死锁时一定是在不安全状态）
安全序列的计算方法：

已知现有三个进程的资源分配表如下(可用代表系统还剩有 3 个资源)，现假设可用资源每次分配都是全部分配，并且分配给进程的资源总数应满足进程最多还需求的资源数目(如：可用资源有 3 个，由于 P2 进程还需要 2 个资源，因此只能满足 P2)，分配完后回收该进程所拥有的全部资源。

计算步骤如下：

因此得到安全序列是 {P2, P1, P3}。

如果计算到 P3 时，可用资源无法满足 P3 的最大需求，即还需要的资源数目多于可用资源数目，那么就不存在安全序列。

注：死锁状态一定是不安全状态，不安全状态不一定是死锁状态，即：死锁状态 ⇒ 不安全状态。

如：A 进程需 10 个资源，而可用资源有 5 个。若 A 还未提出申请，则不会进入死锁状态。

系统进入不安全状态后，便可能进入死锁状态；反之，只要系统处于安全状态，系统变可避免进入死锁。
银行家算法

核心思想： 在分配资源前，预先判断这次分配是否会导致系统进入不安全状态，以此来决定是否答应资源分配请求，从而使得系统避免死锁。
- 数据结构描述：
  - ①可利用资源向量$Available$（一维数据）
  - ②最大需求矩阵$Max$
  - ③分配矩阵$Allocation$
  - ④需求矩阵$Need$
  其中，$Need=Max-Allocation$
  
  注：$Available(A,B,C)=(3,3,2)$代表可用的 A 类资源数目有 3 个，B 类资源数目有3个，C 类资源数目有 2 个。
- 银行家算法描述
  
  设$Request_i$是进程Pi的请求向量，$Request_i[j]=K$表示进程$Pi$需要$j$类资源$K$个。
  - ①若$Request_i[j]≤Need[i，j]$，检查此次申请是否超过最多还需求数。
  - ②若$Request_i[j]≤Available[j]$，检查系统的可用资源是否还能满足此次需求。
  - ③系统试探着把资源分配给$Pi$，并修改下面数据结构的数值：
    
    $Available=Available-Request_i$，修改i进程剩余可用资源数
    
    $Allocation[i，j]=Allocation[i，j]+Request_i[j]$，i进程已分配资源数加上本次请求资源数
    
    $Need[i，j]=Need[i，j]-Request_i[j]$，i进程还需的资源数减去本次请求的资源数
  - ④执行安全性算法，检查系统是否处于安全状态，即检查当前系统是否存在安全序列。
  若系统安全，才正式将资源分配给$Pi$；否则此次试探分配作废，恢复原来分配状态。
  
  注：安全性算法是银行家算法的核心。
- 安全性算法描述
  
  设置工作向量$Work$，表示系统中剩余可用资源数目。算法执行开始时，$Work=Available$
  - ①初始时安全序列为空。
  - ②检查当前的剩余资源是否能满足某个进程的最大需求。如果可以就将它加入安全序列；若找不到执行步骤④
  - ③把该进程持有资源全部回收，返回步骤②
  - ④若此时安全序列中已有所有进程，则系统处于安全状态，否则处于不安全状态。
- 例题
  
  假设当前系统中资源分配和剩余情况如下表所示，现$P1$发出请求向量$Request_1(1，0，2)$，判断此次请求是否分配成功。
  - ① 系统按银行家算法进行检查：
    
    $Request_1(1,0,2)≤Need_1(1,2,2)$，$Request_1(1,0,2)≤Available(3,2,2)$
    
    此次申请未超过$P1$进程最多还需求数,并且当前可用资源数可满足此次申请,则可试探的为$P1$分配资源,并修改:
    
    $Available=Available-Request_1=(2,3,0)$
    $Allocation_1=Allocation_1+Request_1=(3,0,2)$
    $Need_1=Need_1-Request_1=(0,2,0)$
  - ② 系统执行安全性算法检查安全状态：
    
    令$Work=Available=(2,3,0)$，执行安全性算法，如下表所示：
    
    由安全性检查而知，可以找到一个安全序列 { P1, P3, P4, P0, P2 }，因此系统是安全的，可以将P1所申请的资源分配给他。

2.4.4 死锁检测和解除

如果系统既不采取预防死锁的措施，也不采取避免死锁的措施，系统就很可能发生死锁。在这种情况下，系统应当提供死锁检测和解除的手段。

资源分配图

系统死锁可利用资源分配图来描述。圆代表一个进程，框代表一类资源，框中一个圆代表一类资源中的一个资源。
- 两种结点：
  - 进程结点：对应一个进程
  - 资源结点：对应一类资源，一类资源可能有多个
- 两种边：
  - 请求边：表示进程想申请几个资源（每条边代表一个）
  - 分配边：表示已经为进程分配了几个资源（每条边代表一个）
死锁定理

简化资源分配图可检测系统状态是否为死锁状态。简化方法如下：

① 在资源分配图中，找出既不阻塞又不是孤点的进程 Pi。
- 不阻塞：表示进程申请的资源可以被满足，如 P1 进程。由于 R2 资源除分配给 P2 进程一个资源外，还剩有1个资源，因此 P1 进程申请的 R2 资源可以被满足。相反，P2 进程申请 R1 资源则不会被满足，由于 R1 资源全部被分配完。
- 不是孤点：表示与该进程节点至少一个边相连。
② 消去进程所有的请求边和分配边，使之成为孤点。

重复以上步骤，若能消去图中所有的边，则称该图是可完全简化的。

注：并不是系统中所有的进程都是死锁状态，用死锁检测算法化简资源分配图后，还连着边的那些进程就是死锁进程。

死锁定理：如果某时刻系统的资源分配图是不可完全简化的，那么此时系统死锁
死锁解除

一旦检测出死锁的发生，就应该立即解除死锁。解除死锁的主要方法有：
- 资源剥夺法
  
  挂起（暂时放到外存上）某些死锁进程，并抢占它的资源，将这些资源分配给其他的死锁进程。但是应防止被挂起的进程长时间得不到资源而饥饿。
- 撤销进程法（或称终止进程法）
  
  强制撤销部分甚至全部死锁进程，并剥夺这些进程的资源。这种方式的优点是实现简单，但所付出的代价可能会很大。因为有些进程可能已经运行了很长时间，已经接近结束了，一旦被终止可谓功亏一篑，以后还得从头再来。撤销的原则可以按进程优先级和撤销进程代价的高低进行。
- 进程回退法
  
  让一个或多个死锁进程回退到足以避免死锁的地步。进程回退时，自愿释放资源而非剥夺。这就要求系统要记录进程的历史信息，设置还原点。
注：撤销进程法中参考的优先级，应考虑：进程优先级、已执行多长时间、还要多久能完成、进程已经使用了多少资源、进程是交互式的还是批处理式的等因素。