2 进程与线程

2.1 进程与线程

2.1.1 进程的概念和特征

img

img

  1. 进程的概念

    进程是进程实体的运行过程,是系统进行资源分配和调度的一个独立单位。

    进程实现操作系统的并发性和共享性。

    程序:是静态的,就是个存放在磁盘里的可执行文件,如:QQ.exe。

    进程:是动态的,是程序的一次执行过程,或者是一个正在运行的程序,如:可同时启动多次QQ程序。

    进程实体:即进程映像,是静态的,可理解为进程的一次时刻的状态。

    作业:用户向计算机提交的一项任务,是静态的,它通常是一个批处理程序或一个后台程序。

  2. 进程实体的组成

    img

    • 程序控制块PCB

      PCB是进程存在的唯一标志,当进程被创建时,操作系统为其创建PCB,当进程结束时,会回收其PCB。

      • 进程描述信息
        • 进程标识符PID:当进程被创建时,操作系统会为该进程分配一个唯一的、不重复的“身份证号”–PID(Process ID,进程ID)
        • 用户标识符UID
      • 进程控制和管理信息
        • CPU、磁盘、网络流量使用情况统计…
        • 进程当前状态:就绪态/阻塞态/运行态.…
      • 资源分配清单
        • 正在使用哪些文件
        • 正在使用哪些内存区域
        • 正在使用哪些I/O设备
      • 处理机相关信息(CPU现场信息):如PSW、PC等等各种寄存器的值(用于实现进程切换)

    ① PCB,即进程控制块,操作系统需要对各个并发运行的进程进行管理, 但凡管理时所需要的信息,都会被放在 PCB 中。
    ② PCB 是进程存在的唯一标志。
    ③ PCB 存于内存的内核区,注意内存的内核区和 OS 的内核态的区别,内核程序运行在内核态。

    • 程序段:程序的代码(指令序列)
    • 数据段:运行过程中产生的各种数据(如:程序中定义的变量)

    ①PCB 是给操作系统用的,程序段和数据段是给进程自己用的。

    ②引入进程实体的概念后,可把进程定义为是进程实体的运行过程,是系统进行资源分配和调度的一个独立单位。

    img

  3. 进程的特征

    • 动态性:进程是程序的一次执行过程,是动态地产生、变化和消亡的;动态性是进程最基本的特征。
    • 并发性:内存中有多个进程实体,各进程可并发执行
    • 独立性:进程是能独立运行、独立获得资源、独立接受调度的基本单位
    • 异步性:各进程按各自独立的、不可预知的速度向前推进,异步性会导致并发程序执行结果的不确定性。
    • 结构性:每个进程都会配置一个PCB。结构上看,进程由程序段、数据段、PCB组成

2.1.2 进程的状态与转换

img

  1. 基本状态

    • 运行态。占有CPU,并在CPU上运行;√CPU√其他所需资源

    • 就绪态。已具有运行条件,但无空闲CPU,暂时不能运行;×CPU√其他所需资源

      系统中处于就绪状态的进程可能有多个,通常将它们排成一个队列,称为就绪队列。

    • 阻塞态,又称等待态。因等待某一事件暂时不能运行;×CPU×其他所需资源

      系统通常将处于阻塞态的进程也排成一个队列,甚至根据阻塞原因的不同,设置多个阻塞队列。

    • 创建态。进程正在被创建,尚未转到就绪态。OS为进程分配系统资源、初始化PCB

      • 首先申请一个空白PCB,并向PCB中填写用于控制和管理进程的信息
      • 然后为该进程分配运行时所必须的资源
      • 最后把该进程转入就绪态并插入就绪队列

      但是,如果进程所需的资源尚不能得到满足,如内存不足,则创建工作尚未完成,进程此时所处的状态称为创建态。

    • 终止态。进程正从系统中消失,进程正常结束或其他原因退出运行。OS回收进程拥有的资源,撤销PCB

  2. 进程状态的转换

    img

    • 就绪态一>运行态:进程被调度
    • 运行态一>就绪态:时间片到 or CPU被其他进程抢占
    • 运行态一>阻塞态:等待系统资源分配or等待某事件发生(主动行为)
    • 阻塞态一>就绪态:资源分配到位,等待的事件发生(被动行为)
    • 创建态一>就绪态:系统完成创建进程相关的工作
    • 运行态一>终止态:进程运行结束 or 运行过程中遇到不可修复的错误

    img

img

2.1.3 进程的组织方式

img

img

img

  1. 链接方式

    链接方式是将同一状态的进程的PCB组成一个双向链表,称为进程队列。

    • 结构:每个队列的队首和队尾都有一个指针,指向第一个和最后一个PCB。每个PCB中也有两个指针,分别指向前一个和后一个PCB。这样,就可以方便地在队列中插入或删除PCB。
    • 优点:简单、灵活
    • 缺点:查找效率低,需要遍历链表
  2. 索引方式

    索引方式是将所有的PCB存放在一张索引表中,每个表项包含一个PCB的地址和状态信息。

    • 结构:索引表可以是顺序表或散列表,可以按照进程号或其他关键字进行排序或散列。
    • 优点:查找效率高,可以快速定位到某个PCB
    • 缺点:需要额外的空间存储索引表,且索引表的大小受限于内存容量

2.1.4 进程控制

img

进程控制就是要实现进程状态的转换,通过原语实现。

  1. 进程的创建

    img

    • 创建原语:操作系统创建一个进程时使用的原语,其操作如下;创建态→就绪态

      • 申请空白PCB
      • 为新进程分配所需资源
      • 初始化PCB
      • 将PCB插入就绪队列
    • 引起进程创建的事件

      • 用户登录:分时系统中,用户登录成功,系统会建立为其建立一个新的进程
      • 作业调度:多道批处理系统中,有新的作业放入内存时,会为其建立一个新的进程
      • 提供服务:用户向操作系统提出某些请求时,会新建一个进程处理该请求
      • 应用请求:由用户进程主动请求创建一个子进程
    • 父子进程

      允许一个进程创建另一个进程,此时创建者称为父进程,被创建的进程称为子进程

      • 进程可以继承父进程所拥有的资源。
      • 当子进程被撤销时,应将其从父进程那里获得的资源归还给父进程。
      • 在撤销父进程时,通常也会同时撤销其所有的子进程。
  2. 进程的终止

    img

    • 撤销原语:其操作如下;

      就绪态/阻塞态/运行态→终止态→无

      • 从PCB集合中找到终止进程的PCB
      • 若进程正在运行,立即剥夺CPU,将CPU分配给其他进程
      • 终止其所有子进程
      • 将该进程拥有的所有资源归还给父进程或操作系统
      • 删除PCB
    • 引起进程终止的事件

      • 正常结束:进程自已请求终止(exit系统调用)
      • 异常结束:整数除以0、非法使用特权指令,然后被操作系统强行杀掉
      • 外界干预:Ctrl+Alt+delete,用户选择杀掉进程
  3. 进程的阻塞img

    • 阻塞原语:其操作如下;

      运行态→阻塞态

      • 找到要阻塞的进程对应的PCB
      • 保护进程运行现场,将PCB状态信息设置为“阻塞态,暂时停止进程运行
      • 将PCB插入相应事件的等待队列
    • 引起进程阻塞的事件

      • 需要等待系统分配某种资源
      • 需要等待相互合作的其他进程完成工作
  4. 进程的唤醒

    • 唤醒原语:其操作如下;

      阻塞态→就绪态

      • 在事件等待队列中找到PCB
      • 将PCB从等待队列移除,设置进程为就绪态
      • 将PCB插入就绪队列,等待被调度
    • 引起进程唤醒的事件

      • 等待的事件发生:因何事阻塞,就应由何事唤醒

    阻塞原语唤醒原语必须成对使用

  5. 进程的切换

    img

    • 切换原语:其操作如下;

      运行态→就绪态,就绪态→运行态

      • 将运行环境信息存入PCB
      • PCB移入相应队列选择
      • 另一个进程执行,并更新其PCB
      • 根据PCB恢复新进程所需的运行环境
    • 引起进程切换的事件

      • 当前进程时间片到
      • 有更高优先级的进程到达
      • 当前进程主动阻塞
      • 当前进程终止

2.1.5 进程的通信

img

低级通信方式:PV操作。高级通信方式:共享存储、消息传递、管道通信。

  1. 共享存储

    img

    设置一个共享空间,通过对其进行读/写操作实现信息交换

    image-20230908090734034

    在对共享空间进行写/读操作时,需要使用同步互斥工具(如PV操作)。

    共享存储分为两种:

    • 低级方式:基于数据结构的共享

      比如共享空间里只能放一个长度为10的数组。这种共享方式速度慢、限制多,是一种低级通信方式

    • 高级方式:基于存储区的共享

      操作系统在内存中划出一块共享存储区,数据的形式、存放位置都由通信进程控制,而不是操作系统。这种共享方式速度很快,是一种高级通信方式。

    进程之间共享空间需要通过特殊的系统调用实现;进程内线程共享进程空间。

  2. 消息传递

    img

    在消息传递系统中,进程间的数据交换以格式化的消息(Message)为单位。

    image-20230908091456671

    进程通过操作系统提供的“发送消息/接收消息”两个原语进行数据交换。

    微内核操作系统中,微内核与服务器之间的通信就采用了消息传递机制。

    消息格式

    • 消息头:发送进程ID、接受进程ID、消息长度等格式化的信息
    • 消息体

    通信方式

    • 直接通信方式:发送进程直接把消息发送给接收进程,并将它挂在接收进程的消息缓冲队列上,接收进程从消息缓冲队列中取得消息。

    • img

    • 间接通信方式:送进程通过信箱间接地通信,将消息发送到某个中间实体,接收进程从中间实体取得消息。该通信方式广泛应用于计算机网络中。

    • img

      注:可以多个进程往同一个信箱 send 消息,也可以多个进程从同一个信箱中 receive 消息。

      用发送原语和接收原语实现基于信箱的进程间通信

  3. 管道通信

    管道是一个特殊的共享文件,又名pipe文件。其实就是在内存中开辟一个大小固定的内存缓冲区。

    管道通信允许两个进程按生产者-消费者方式进行通信。各进程要互斥访问管道。

    • 写满时,不能再写,读空时,不能再读
    • 没写满时,不能读,没读空时,不能写

    image-20230908101047933

    一个管道只能实现半双工通信;实现双向同时通信要建立两个管道

    • 管道本质上是一种特殊的文件。相比于普通的文件通信,其区别如下:
      • 限制管道的大小。管道文件是一个固定大小的缓冲区,使得它的大小不像普通文件那样不加检验地增长。
      • 读进程也可能工作得比写进程快。读空时再读管道会被阻塞,而不是调用返回文件结束。
    • 管道中的数据一旦被读出,就彻底消失。因此,当多个进程读同一个管道时,可能会错乱。对此,通常有两种解决方案:
      • ①一个管道允许多个写进程,一个读进程(2014年408真题高教社官方答案);
      • ②允许有多个写进程,多个读进程,但系统会让各个读进程轮流从管道中读数据(Liux的方案)。

    管道只能由创建进程所访问,当父进程创建一个管道后,由于管道是一种特殊文件,子进程会继承父进程的打开文件,因此子进程也继承父进程的管道,并使用它来与父进程进进行通信。

2.1.6 线程和多线程模型

img

  1. 线程的基本概念

    线程可理解为轻量级进程,它是一个基本的CPU执行单元,也是程序执行流的最小单位。

    线程由线程ID、程序计数器、寄存器集合和堆栈组成。

    引入进程的目的是更好地使多道程序并发执行,提高资源利用率和系统吞吐量;

    而引入线程的目的则是减小程序在并发执行时所付出的时空开销,提高操作系统的并发性能。

    引入线程后,进程只作为除CPU外的系统资源的分配单位,线程则作为处理机的分配单元

  2. 线程与进程的比较

    传统进程机制 引入线程后
    资源分配、调度 进程是资源分配、调度基本单位 进程是资源分配基本单位 线程是资源调度基本单位
    并发性 进程间并发 线程间也能并发
    拥有资源 拥有资源的基本单位 不拥有系统资源
    独立性 进程间独立地址空间和资源 同进程下的线程共享地址空间和资源
    系统开销 需要切换进程运行环境,开销大 同一进程内线程,不需切换进程环境,开销小
    支持多处理机系统 进程只能运行在一个处理机上 进程中多个线程可以分配到多个处理机执行

    img

  3. 线程的属性

    多线程操作系统中的进程已不再是一个基本的执行实体,但它仍具有与执行相关的状态。所谓进程处于“执行”状态,实际上是指该进程中的某线程正在执行。

    • 线程是处理机调度的单位
    • 多CPU计算机中,各个线程可占用不同的CPU
    • 每个线程都有一个线程ID、线程控制块(TCB)
    • 线程也有就绪、阻塞、运行三种基本状态
    • 线程几乎不拥有系统资源
    • 同一进程的不同线程间共享进程的资源
    • 由于共享内存地址空间,同一进程中的线程间通信甚至无需系统干预
    • 同一进程中的线程切换,不会引起进程切换
    • 不同进程中的线程切换,会引起进程切换
    • 切换同进程内的线程,系统开销很小
    • 切换进程,系统开销较大

    注:线程是处理机调度的单位,这里的线程指的是 操作系统看得见的内核级线程,内核级线程是处理机分配的单位

    同进程的线程之间可以共享进程的代码段、全局变量、打开的文件,不共享线程各自的栈指针等TCB内容

  4. 线程的实现方式

    img

    线程的实现可以分为两类:用户级线程 和 内核级线程。内核级线程又称内核支持的线程。

    • 用户级线程

      在用户级线程中,有关线程管理(创建、撤销和切换等)的所有工作都由应用程序在用户空间中完成,内核意识不到线程的存在,因此说用户级线程对操作系统透明。

      • 用户级线程由应用程序通过线程库实现,所有的线程管理工作都由应用程序负责(包括线程切换)
    • 用户级线程中,线程切换可以在用户态下即可完成,无需操作系统干预。

      • 用户看来,是有多个线程。但是在操作系统内核看来,并意识不到线程的存在。“用户级线程”就是“从用户视角看能看到的线程

      若系统中只有用户级线程,则处理机的调度对象是进程

      优点

      • 用户级线程的切换在用户空间即可完成,不需要切换到核心态,
    • 线程管理的系统开销小,效率高

      缺点

      • 当一个用户级线程被阻塞后,整个进程都会被阻塞,并发度不高。
    • 多个线程不可在多核处理机上并行运行

    img

    • 内核级线程

      内核级线程是在内核的支持下运行的,线程管理的所有工作也是在内核空间内实现的。

      • 内核级线程的管理工作由操作系统内核完成。
      • 线程调度、切换等工作都由内核负责,因此内核级线程的切换必然需要在核心态下才能完成。
      • 操作系统会为每个内核级线程建立相应的TCB(Thread Control Block,线程控制块)通过TCB对线程进行管理。“内核级线程”就是“从操作系统内核视角看能看到的线程”

      优点

      • 当一个线程被阻塞后,别的线程还可以继续执行,并发能力强。
      • 多线程可在多核处理机上并行执行。

      缺点

      • 一个用户进程会占用多个内核级线程,线程切换由操作系统内核完成,需要切换到核心态,因此线程管理的成本高,开销大。
      用户级线程 内核级线程
      线程的管理工作由谁来完成 由 应用程序 通过线程库实现所有的线程管理工作 ,包括线程切换 线程管理工作由 操作系统内核完成
      线程切换是否需要 CPU 变态 用户级线程切换 可以在用户态下即可完成 ,无需操作系统干预 线程调度、切换等工作都由内核负责,因此 内核级线程的切换 必然需要在 核心态 下才能完成。
      OS 是否能意识到用户级线程的存在 OS 内核意识不到用户级线程的存在 用户级线程就是从用户视角看能看到的线程 OS 会为每个内核级线程建立相应的 TCB(线程控制块) 通过TCB对线程进行管理 内核级线程就是从操作系统内核视角看能看到的线程
      优点 用户级线程的切换在用户空间即可完成, 不需要切换到核心态,线程管理的系统开销小,效率高 当一个线程被阻塞后,其他线程还可以继续执行,并发能力强 多线程可在多核处理机上并行执行
      缺点 当一个用户级线程被阻塞后,整个进程都会被阻塞,并发度不高 因为进程是处理机调度的基本单位,同一进程的多个线程不可在多核处理机上并行运行 一个用户进程会占用多个内核级线程,线程切换由操作系统内核完成 需要切换到核心态,因此线程管理的开销大,效率低,成本高
    • 组合方式

      有些系统使用组合方式的多线程实现。在组合实现方式中,内核支持多个内核级线程的建立、调度和管理,同时允许用户程序建立、调度和管理用户级线程。

      image-20230908113303239

      • 一些内核级线程对应多个用户级线程,这是用户级线程通过时分多路复用内核级线程实现的。
      • 同一进程中的多个线程可以同时在多处理机上并行执行,
      • 且在阻塞一个线程时不需要将整个进程阻塞,
    • 线程库

      线程库是为程序员提供创建和管理线程的API。实现方式有以下两种。

      • ①在用户空间中提供一个没有内核支持的库。这种库的所有代码和数据结构都位于用户空间中。这意味着,调用库内的一个函数只导致用户空间中的一个本地函数的调用。
      • ②实现由操作系统直接支持的内核级的一个库。对于这种情况,库内的代码和数据结构位于内核空间。调用库中的一个API函数通常会导致对内核的系统调用。
  5. 多线程模型

    img

    • 一对一模型

      一个用户级线程映射到一个内核级线程。每个用户进程有与用户级线程同数量的内核级线程。

      • 优点:当一个线程被阻塞后,别的线程还可以继续执行,并发能力强。多线程可在多核处理机上并行执行。(内核级线程优点)
      • 缺点:一个用户进程会占用多个内核级线程,线程切换由操作系统内核完成,需要切换到核心态,因此线程管理的成本高,开销大。(内核级线程缺点)
    • 多对一模型img

      多个用户级线程映射到一个内核级线程。且一个进程只被分配一个内核级线程。

      • 优点:用户级线程的切换在用户空间即可完成,不需要切换到核心态,线程管理的系统开销小,效率高(用户级线程优点)
      • 缺点:当一个用户级线程被阻塞后,整个进程都会被阻塞,并发度不高。多个线程不可在多核处理机上并行运行(用户级线程缺点)
    • 多对多模型

      n用户及线程映射到m个内核级线程(n>=m)。每个用户进程对应m个内核级线程。

      img

      克服了多对一模型并发度不高的缺点(一个阻塞全体阻塞),又克服了一对一模型中一个用户进程占用太多内核级线程,开销太大的缺点。还拥有上述两种模型各自的优点。

  6. 线程的状态与转换

    image-20230908114535993

  7. 线程的组织与控制

    image-20230908123934054

    • 线程控制块

      与进程类似,系统也为每个线程配置一个线程控制块TCB,用于记录控制和管理线程的信息。线程控制块通常包括

      • ①线程标识符
      • ②一组寄存器,包括程序计数器、状态寄存器和通用寄存器
      • ③线程运行状态,用于描述线程正处于何种状态
      • ④优先级
      • ⑤线程专有存储区,线程切换时用于保存现场等
      • ⑥堆栈指针,用于过程调用时保存局部变量及返回地址等。

      同一进程中的所有线程都完全共享进程的地址空间和全局变量。

      各个线程都可以访问进程地址空间的每个单元,所以一个线程可以读、写或甚至清除另一个线程的堆栈。

    • 线程的创建

      用户程序启动时,通常仅有一个称为“初始化线程”的线程正在执行,其主要功能是用于创建新线程。

      在创建新线程时,需要利用一个线程创建函数,并提供相应的参数,如指向线程主程序的入口指针、堆栈的大小、线程优先级等。线程创建函数执行完后,将返回一个线程标识符。

    • 线程的终止

      当一个线程完成自己的任务后,或线程在运行中出现异常而要被强制终止时,由终止线程调用相应的函数执行终止操作。

      但是有些线程(主要是系统线程)一旦被建立,便一直运行而不会被终止。通常,线程被终止后并不立即释放它所占有的资源,只有当进程中的其他线程执行了分离函数后,被终止线程才与资源分离,此时的资源才能被其他线程利用。

      被终止但尚未释放资源的线程仍可被其他线程调用,以使被终止线程重新恢复运行。

错题总结:

1.线程包含CPU现场,可以独立执行程序

2.并发进程的运行结果具有不可再现性

3.在单处理器系统中任何时刻都只有一个进程处于运行态(X)所有进程都死锁

4.一个进程在同一时刻不能执行多个程序,只能执行一个程序

5.分时系统中,处于就绪态的进程最多

6.并发进程失去封闭性是指:并发进程共享变量,其执行结果与速度有关

7.进程是资源分配的单位,内核级线程是调度和分派的单位

8.速度最快的进程通信方式:共享内存

9.第27题

10.线程不会增加进程安全性

11.51题A

12.用户级线程切换是咱们自己控制的

13.同一进程的若干线程不能共享某个线程的栈指针

14.管道只允许单向的数据传输

双向传输需要两个管道

15.父子进程不是完全共享父进程虚拟地址空间,只是共享一部分

2.2 处理机调度

2.2.1 调度的概念

img

  1. 调度的基本概念

    处理机调度是对处理机进行分配,即从就绪队列中按照一定的算法(公平、高效的原则)去选择一个进程并将处理机分配给它运行,以实现进程并发地执行。

  2. 调度对层次

    一个作业从提交开始直到完成,要经历以下三级调度,如下图所示。

    image-20230911135226560

    • 高级调度(作业调度)

      img

      内存空间有限时,无法将用户提交的作业全部放入内存,需要按一定的原则从外存的作业 后备队列 中挑选一个作业调入内存,并创建进程。

      每个作业只调入一次,调出一次。作业调入时会建立PCB,调出时才撤销PCB。

      作业:一个具体的任务

      多道批处理系统中大多配有作业调度,而其他系统中通常不需要配置作业调度。

      • 发生频率最低 外存→内存(面向作业)
    • 中级调度(内存调度)img

      内存不够时,可将某些进程的数据调出外存。等内存空闲或者进程需要运行时,按照某种策略从 挂起队列 中选择合适的进程重新调入内存。

      暂时调到外存等待的进程状态为挂起状态。被挂起的进程PCB会被组织成挂起队列。

      • 外存→内存(面向进程)
    • 低级调度(进程调度)

      img

      在内存中的按照某种策略从 就绪队列 中选取一个进程,将处理机分配给它。

      • 发生频率高 内存→CPU
  3. 三级调度的联系

    • 七状态模型

      在这里插入图片描述

      挂起和阻塞的区别: 两种状态都不获得 CPU 服务,但挂起状态将进程调到外存,而阻塞态还在内存中。

    • 三层调度对比

      要做什么 在哪调度 发生频率 对进程状态影响
      高级调度 (作业调度) 从后备队列中选择合适的作业 将其调入内存,并为其创建进程 外存→内存 (面向作业) 最低 无→创建态→就绪态
      中级调度 (内存调度) 从挂起队列中选择合适的进程 将其数据调回内存 外存→内存 (面向进程) 中等 挂起态→就绪态 阻塞挂起→阻塞态
      低级调度 (进程调度) 从就绪队列中选择一个进程 为其分配处理机 内存→CPU 最高 就绪态→运行态
    • 三层调度联系

      • 1)作业调度为进程活动做准备,进程调度使进程正常活动起来。
      • 2)中级调度将暂时不能运行的进程挂起,中级调度处于作业调度和进程调度之间。
      • 3)作业调度次数少,中级调度次数略多,进程调度频率最高。
      • 4)进程调度是最基本的,不可或缺。

2.2.2 调度的目标

img

不同的调度算法具有不同的特性,在选择调度算法时,必须考虑算法的特性。评价标准如下。

  1. CPU利用率:指CPU“忙碌”的时间占总时间的比例。
    $$
    利用率=\frac{忙碌的时间}{总时间}
    $$

  2. 系统吞吐率:单位时间内完成作业的数量。
    $$
    系统吞吐率=\frac{总共完成了多少道作业}{总共花了多少时间}
    $$

  3. 周转时间:指从作业被提交给系统开始,到作业完成为止的这段时间间隔。
    $$
    周转时间=作业完成时间-作业提交时间
    $$
    平均周转时间:指多个作业周转时间的平均值。
    $$
    平均周转时间=\frac{各个作业周转时间之和}{作业数}
    $$
    带权周转时间:作业周转时间与作业实际运行时间的比值。带权周转时间必然≥1
    $$
    带权周转时间=\frac{作业周转时间}{作业实际运行时间}=\frac{作业完成时间-作业提交时间}{作业实际运行时间}
    $$
    平均带权周转时间:多个作业带权周转时间的平均值。
    $$
    平均带权周转时间=\frac{各个作业带权周转时间之和}{作业数}
    $$

  4. 等待时间

    等待时间,指进程/作业处于等待处理机状态时间之和,等待时间越长,用户满意度越低。
    $$
    等待时间=周转时间-运行时间
    $$

    • 对于进程来说,等待时间就是指进程建立后等待被服务的时间之和。
    • 对于作业来说,不仅要考虑建立进程后的等待时间,还要加上作业在外存后备队列中等待的时间。

    平均等待时间:各个进程/作业等待时间的平均值。
    $$
    平均等待时间=\frac{各个进程/作业等待时间之和}{进程/作业数}
    $$

  5. 响应时间:从用户提交请求到首次产生响应所用的时间。

2.2.3 调度的实现

  1. 调度程序(调度器)

    img

    img

    用于调度和分派CPU 的组件称为调度程序,它通带由三部分组成,如图所示。

    image-20230911150133174

    • 排队器:将系统中的所有就绪进程按照一定的策略排成一个或多个队列,以便于调度程序选择。每当有一个进程转变为就绪态时,排队器便将它插入到相应的就绪队列中。

    • 分派器:依据调度程序所选的进程,将其从就绪队列中取出,将CPU分配给新进程。

    • 上下文切换器:在对处理机进行切换时,会发生两对上下文的切换操作:

      • 第一对,将当前进程的上下文保存到其PCB中,再装入分派程序的上下文,以便分派程序运行;
    • 第二对,移出分派程序的上下文,将新选进程的CPU现场信息装入处理机的各个相应寄存器。

  2. 调度的时机

    img

    img

    • 需要调度
      • 主动放弃:进程正常终止;运行过程中发生异常而终止;主动阻塞(比如等待IO)
      • 被动放弃:时间片用完;有更紧急的事情处理(I/O中断);有更高优先级的进程进入就结队列
    • 不能调度
      • 处理中断的过程中
      • 进程在操作系统内核程序临界区中
      • 原子操作过程中

    临界资源:一个时间段内只允许一个进程使用的资源。各进程需要互斥地访问临界资源。

    临界区:访问临界资源的那段代码。

    内核程序临界区一般是用来访问某种内核数据结构的,比如进程的就绪队列(由各就绪进程的PCB组成)

  3. 进程调度方式

    img

    • 非剥夺调度方式

      又称非抢占方式。即,只允许进程主动放弃处理机。在运行过程中即便有更紧迫的任务到达,当前进程依然会继续使用处理机,直到该进程终止或主动要求进入阻塞态。

      实现简单,系统开销小但是无法及时处理紧急任务,适合于早期的批处理系统

    • 剥夺调度方式

      又称抢占方式。当一个进程正在处理机上执行时,如果有一个更重要或更紧迫的进程需要使用处理机,则立即暂停在执行的进程,将处理机分配给更重要紧迫的那个进程。

      可以优先处理更紧急的进程,也可实现让各进程按时间片轮流执行的功能(通过时钟中断)。适合于分时操作系统、实时操作系统

  4. 进程切换

    • 上下文切换:切换CPU到另一个进程需要保存当前进程状态并恢复另一个进程的状态。

      • 对原来运行进程各种数据的保存
      • 对新的进程各种数据的恢复(如:程序计数器、程序状态字、各种数据寄存器等处理机现场信息,这些信息一保存在进程控制块)

      上下文:某一时刻CPU寄存器和程序计数器的内容。

      切换流程:

      • 挂起一个进程,保存CPU上下文,包括程序计数器和其他寄存器。
      • 更新PCB信息。
      • 把进程的PCB移入相应的队列,如就绪、在某事件阻塞等队列。
      • 选择另一个进程执行,并更新其PCB。
      • 跳转到新进程PCB中的程序计数器所指向的位置执行。
      • 恢复处理机上下文。
    • 上下文切换的消耗

      上下文切换需要消耗大量CPU时间,有些处理器有多个寄存器组,则切换只需改变指针。

      进程切换是有代价的,因此如果过于频繁的进行进程调度、切换,必然会使整个系统的效率降低,使系统大部分时间都花在了进程切换上,而真正用于执行进程的时间减少。

    • 上下文切换与模式切换

      • 模式切换是用户态和内核态之间的切换,CPU逻辑上可能还在执行同一进程。用户进程最开始都运行在用户态,若进程因中断或异常进入核心态运行,执行完后又回到用户态刚被中断的进程运行。
      • 上下文切换切换了进程,只能发生在内核态,它是多任务操作系统中的一个必需的特性。

    不能进行调度和切换的情况:

    1.处理中断的过程中

    2.需要完全屏蔽中断的原子操作过程中

  5. 闲逛进程

    调度程序永远的备胎,没有其他就绪进程时,运行闲逛进程(idle)

    特性

    • 优先级最低;
    • 可以是0地址指令,占一个完整的指令周期(指令周期末尾例行检查中断)
    • 能耗低

    闲逛进程不需要CPU之外的资源,它不会被阻塞。

  6. 两种线程的调度

    • 用户级线程调度。由于内核并不知道线程的存在,所以内核还是和以前一样,选择一个进程,并给予时间控制。由进程中的调度程序决定哪个线程运行。
    • 内核级线程调度。内核选择一个特定线程运行,通常不用考虑该线程属于哪个进程。对被选择的线程赋予一个时间片,如果超过了时间片,就会强制挂起该线程。

    用户级线程的线程切换在同一进程中进行,仅需少量的机器指令;

    内核级线程的线程切换需要完整的上下文切换、修改内存映像、使高速缓存失效,这就导致了若干数量级的延迟。

2.2.4 典型的调度算法

img

img

  1. 先来先服务(FCFS)

    • 算法思想:主要从“公平”的角度考虑(类似于我们生活中排队买东西的例子)
    • 算法规则:按照作业/进程到达的先后顺序进行服务
    • 用于作业/进程调度:
      • 用于作业调度时,考虑是哪作业先达后备队列;
      • 用于进程调度时,考虑的是哪个进程先到达就绪队列
    • 优缺点:
      • 优点:公平、算法实现简单
      • 缺点:排在长作业(进程)后面的短作业需要等待很长时间,带权周转时间很大,对短作业来说用户体验不好。即,FCFS算法对长作业有利,对作(Eg:排队。)
    • 非抢占式的算法;不会导致饥饿

    img

    img

  2. 短作业优先(SJF)

    • 算法思想:追求最少的平均等待时间,最少的平均周转时间、最少的平均平均带权周转时间

    • 算法规则:最短的作业/进程优先得到服务(所谓“最短”,是指要求服务时间最短)

    • 用于作业/进程调度

      • 即可用于作业调度,也可用于进程调度。
      • 用于进程调度时为”短进程优先”(SPF,Shortest Process First)
    • 优缺点

      • 优点:

        “最短的”平均等待时间、平均周转时间;

        • 在所有进程都几乎同时到达时,采用SJF调度算法的平均等待时间、平均周转时间最少;
      • “抢占式的短作业/进程优先调度算法(最短剩余时间优先,SRNT算法)的平均等待时间、平均周转时间最少”

      • 缺点:不公平。对短作业有利,对长作业不利。可能产生饥饿现象。另外,作业进程的运行时间是由用户提供的,并不一定真实,不一定能做到真正的短作业优先。

    • 抢占式的算法;会导致饥饿

      SJF和SPF是非抢占式的算法。但是也有抢占式的版本:最剩间优先算法(SRTN,Shortest Remaining Time Next)

      每当有进程加入就绪队列改变时就需要调度,如果新到达的进程剩余时间比当前运行的进程剩余时间更短,则由新进程抢占处理机,当前运行进程重新回到就绪队列。另外,当一个进程完成时也需要调度

    img

    img

    img

    img

  3. 高响应比优先(HRRN)

    饿的越久,叫的越大声

    • 算法思想:要综合考虑作业/进程的等待时间和要求服务的时间

    • 算法规则:在每次调度时先计算各个作业/进程的响应比,选择响应比最高的作业/进程为其服务
      $$
      响应比=\frac{等待时间+要求服务时间}{要求服务时间}
      $$
      高响应比优先算法:非抢占式的调度算法,只有当前运行的进程主动放CPU(常/常成,主动阻塞),需行调度,调度时计算所有就绪进程的响应比,选响应比最高的进程上处理机。

    • 用于作业/进程调度:即可用于作业调度,也可用于进程调度

    • 优缺点

      • 综合考虑了等待时间和运行时间(要求服务时间)等待时间相同时,要求服务时间短的优先(SJF的优点);
      • 要求服务时间相同时,等待时间长的优先(FCFS的优点)
      • 对于长作业来说,随着等待时间越来越久,其响应比也会越来越大,从而避免了长作业饥饿的问题
    • 非抢占式的算法;不会导致饥饿

      非抢占式的算法。因此只有当前运行的作业/进程主动放弃处理机时,才需要调度,计算响应比

      img

      img

  4. 时间片轮转调度算法(RR)

    img

    img

    img

    • 算法思想:公平地、轮流地为各个进程服务,让每个进程在一定时间间隔内都可以得到响应

    • 算法规则:按照各进程到达就绪队列的顺序,轮流让各个进程执行一个时间片(如100ms)。若进程未在一个时间片内执行完,则剥夺处理机,将进程重新放到就绪队列队尾重新排队。

    • 用于作业/进程调度:用于进程调度(只有作业放入内存建立了相应的进程后,才能被分配处理机时间片)

    • 优缺点

      • 优点:公平;响应快,适用于分时操作系统;
      • 缺点:由于高频率的进程切换,因此有一定开销;不区分任务的紧急程度。
    • 抢占式的算法;不会导致饥饿

      若进程未能在时间片内运行完,将被强行剥夺处理机使用权,因此时间片轮转调度算法属于抢占式的算法。由时钟装置发出时钟中断来通知CPU时间片已到

  5. 优先级调度算法

    • 算法思想:随着计算机的发展,特别是实时操作系统的出现,越来越多的应用场景需要根据任务的紧急程度来决定处理顺序

    • 算法规则:每个作业/进程有各自的优先级,调度时选择优先级最高的作业/进程

    • 用于作业/进程调度:既可用于作业调度,也可用于进程调度。甚至,还会用于在之后会学习的I/O调度中

    • 优缺点

      • 优点:用优先级区分紧急程度、重要程度,适用于实时操作系统。可灵活地调整对各种作业/进程的偏好程度
      • 缺点:若源源不断地有高优先级进程到来,则可能导致饥饿
    • 抢占式/非抢占式的算法;会导致饥饿

      抢占式、非抢占式都有。做题时的区别在于:非抢占式只需在进程主动放弃处理机时进行调度即可,而抢占式还需在就绪队列变化时,检查是否会发生抢占。

    • 优先级排序

      系统进程优先级高于用户进程

      前台进程优先级高于后台进程

      操作系统更偏好I/O型进程(或称I/O繁忙型进程)

      注:与I/O型进程相对的是计算型进程(或称CPU繁忙型程)

    • 优先级分类:根据优先级是否可以动态改变,可将优先级分为静态优先级和动态优先级两种。

      • 静态优先级:创建进程时确定,之后一直不变
      • 动态优先级:创建进程时有一个初始值,之后会根据情况动态地调整优先级。

      就绪队列未必只有一个,可以按照不同优先级来组织。另外,也可以把优先级高的进程排在更靠近队头的位置

      img

      img

      img

      img

  6. 多级队列调度算法

    • 系统中按进程类型设置多个队列,进程创建成功后插入某个队列

    image-20230911165310270

    • 队列之间可采取固定优先级,或时间片划分

      • 固定优先级:高优先级空时低优先级进程才能被调度
      • 时间片划分:如三个队列分配时间50%、40%、10%
    • 各队列可采用不同的调度策略,如

      系统进程队列采用优先级调度、交互式队列采用RR、批处理队列采用FCFS

  7. 多级反馈队列调度算法

    image-20230911165245192

    • 算法思想:对其他调度算法的折中权衡

    • 算法规则:

      • 1.设置多级就绪队列,各级队列优先级从高到低,时间片从小到大
      • 2.新进程到达时先进入第1级队列,按FCFS原则排队等待被分配时间片,若用完时间片进程还未结束,则进程进入下一级队列队尾。如果此时已经是在最下级的队列,则重新放回该队列队尾
      • 3.只有第k级队列为空时,才会为k+1级队头的进程分配时间片
    • 用于作业/进程调度:用于进程调度

    • 优缺点

      • 对各类型进程相对公平(FCFS的优点);
      • 每个新到达的进程都可以很快就得到响应(RR优点);
      • 短进程只用较少的时间就可完成(SPF优点);
      • 不必实现估程运时间(避用户作假);
      • 可灵活地调整对各类进程的偏好程度,比如CPU密集型进程、IO密集型进程

      拓展:可以将因I/O而阻塞的进程重新放回原队列,这样I/O型进程就可以保持较高优先级

    • 抢占式的算法;会导致饥饿

      在k级队列的进程运行过程中,若更上级的队列(1~k-1级)中进入了一个新进程,则由于新进程处于优先级更高的队列中,因此新进程会抢占处理机,原来运行的进程放回k级队列队尾。

    • img

    • img

先来先服务 短作业优先 高响应比优先 时间片轮转 多级反馈队列
能否是可抢占 队列内算法不一定
能否是非抢占 队列内算法不一定
优点 公平,实现简单 平均等待时间最少,效率最高 兼顾长短作业 兼顾长短作业 兼顾长短作业, 有较好的的响应时间, 可行性强
缺点 不利于短作业 长作业会饥饿, 估计时间不易确定 计算响应比的开销大 平均等待时间较长, 上下文切换浪费时间
适用于 作业调度, 批处理系统 分时系统 相当通用
默认决策模式 非抢占 非抢占 非抢占 抢占 抢占

错题总结:

1.时间片轮转不能使系统高效,效率不会批处理,但是会让多个用户能够得到及时响应

2.处于临界区的进程在退出临界区前,可以被调度(中断或被抢占)

3.进程上下文不包括中断向量

4.上下文切换不包括主存和外村的数据交换

5.先来先服务利于cpu繁忙型作业,不利于IO繁忙型作业

6.多级反馈队列系统开销较大

7.降低进程优先级一般是进程执行完了以后进行降低

2.3 同步与互斥

2.3.1 同步与互斥的基本概念

img

img

  1. 临界资源:一次仅允许一个进程使用的资源

    • 类型:物理设备,如打印机等;可被进程共享的许多变量、数据等

    • 临界区:访问临界资源的那段代码。

      为了保证临界资源的正确使用,可把临界资源的访问过程分成4个部分:

      • 1)进入区。为了进入临界区使用临界资源,在进入区要检查可否进入临界区,若能进入临界区,则应设置正在访问临界区的标志,以阻止其他进程同时进入临界区。
      • 2)临界区。进程中访问临界资源的那段代码,又称临界段。
      • 3)退出区。将正在访问临界区的标志清除。
      • 4)剩余区。代码中的其余部分。
      • img
      1
      2
      3
      4
      5
      6
      do{
      entry section; //进入区
      critical section; //临界区
      exit section; //退出区
      remainder section; //剩余区
      }while(true)
  2. 同步

    • 同步亦称直接制约关系,它是指为完成某种任务而建立的两个或多个进程,这些进程因为需要在某些位置上协调它们的工作次序而产生的制约关系。进程间的直接制约关系就是源于它们之间的相互合作。
    • 读进程和写进程并发地运行,由于并发必然导致异步性,因此“写数据”和“读数据”两个操作执行的先后顺序是不确定的。而实际应用中,又必须按照“写数据→读数据”的顺序来执行的。

    如何解决这种异步问题,就是“进程同步”所讨论的内容。

    img

  3. 互斥

    互斥也称间接制约关系。当一个进程进入临界区使用临界资源,另一进程必须等待当占用临界资源的进程退出临界区后,另一进程才能访问此临界资源。

    遵循原则:

    • 空闲让进。临界区空闲时,可以允许一个请求进入临界区的进程立即进入临界区;
    • 忙则等待。当已有进程进入临界区时,其他图进入临界区进必须等待
    • 有限等待。对请求访问的进程,应保证能在有限时间内进入临界区(保证不会饥饿)
    • 让权等待。当进程不能进入临界区时,应立即释放处理机,防止进程忙等待。

img

2.3.2 实现临界区互斥的基本方法

软件实现方法

img

  1. 单标志法(违背“空闲让进”原则)

    img

    两个进程在访问完临界区后会把使用临界区的权限转交给另一个进程。也就是说每个进程进入临界区的权限只能被另一个进程赋予。

    该算法设置一个公用整型变量turn,用于指示被允许进入临界区的进程编号。

    若某个进程不再进入临界区,则另一个 进程也将无法进入临界区(违背”空闲让进”)。

  2. 双标志法先检查(违背“忙则等待”原则)

    img

    在每一个进程访问临界区资源之前,先查看一下临界区资源是否正被访问,若正被访问,该进程需等待:否则,进程才进入自己自己的临界区。

    设置一个布尔型数组flag[ ],数组中各个元素用来标记各进程想进入临界区的意愿,比如“flag[0]=ture”意味着0号进程P0现在想要进入临界区。每个进程在进入临界区之前先检查当前有没有别的进程想进入临界区,如果没有,则把自身对应的标志flag设为true,之后开始访问临界区。

    • 优点:不用交替进入,可连续使用
    • 缺点:按序列①⑤②⑥执行时,会同时进入临界区(违背“忙则等待”),Pi进程和Pj进程可能同时进入临界区;检查和修改操作不能一次进行。
  3. 双标志法后检查

    img

    双标志先检查法的改版。前一个算法的问题是先“检查”后“上锁”,但是这两个操作又无法一气呵成,因此导致了两个进程同时进入临界区的问题。因此,人们又想到先“上锁”后“检查”的方法,来避免上述问题。

    • 缺点:当两个进程几乎同时都想进入临界区时,它们分别将自己的标志值设置为TRUE,并且同时检测对方的状态,发现对方也要进入临界区,于是双方互相谦让,结果谁也进不了临界区,从而导致“饥饿”现象。违背了“空闲让进”和“有限等待”产生饥饿
  4. Peterson算法

    img

    结合双标志法、单标志法的思想。如果双方都争着想进入临界区,那可以让进程尝试“孔融让梨”(谦让)。做一个有礼貌的进程。

    • 为了防止两个进程为进入临界区而无限期等待,又设置了变量turn,每个进程在先设置自己的标志后再设置turn标志。这时,再同时检测另一个进程状态标志和允许进入标志,以便保证两个进程同时要求进入临界区时,只允许一个进程进入临界区。
    • 进程在进入区要做的步骤: ① 主动争取 ② 主动谦让 ③ 检查对方是否也想使用,且最后一次是不是自己说了客气话
    • 存在问题:Peterson 算法用软件方法解决了进程互斥问题, 遵循 “空闲让进”、“忙则等待”、“有限等待” 三个原则,但是依然 未遵循 “让权等待” 的原则。
  5. 软件方法总结

    单标志法 双标志先检查 双标志后检查 Peterson 算法
    算法 在进入区只做“检查”,不”上锁“ 在退出区把临界区的使用权转交给另一个进程 (相当于在退出区既给另一进程”解锁”,又给自己”上锁”) 在进入区先”检查”后”上锁”,退出区”解锁“ 在进入区先”加锁”后”检查”,退出区”解锁” 在进入区”主动争取一主动谦让一检查对方是否想进、已方是否谦让“
    问题 不遵循”空闲让进” 不遵循”忙则等待” 不遵循”空闲让进、有限等待”,可能导致”饥饿” 不遵循”让权等待”,会发生”忙等”

硬件实现方法

img

  1. 中断屏蔽方法

    img

    当一个进程正在使用处理机执行它的临界区代码时,要防止其他进程再进入其临界区访问的最简单的方法是:禁止一切中断发生,或称之为屏蔽中断、关中断。

    1
    2
    3
    关中断;
    临界区;
    开中断;
    • 优点:简单、高效
    • 缺点:不适用于多处理机;只适用于操作系统内核进程,不适用于用户进程(因为开/关中断指令只能运行在内核态,这组指令如果能让用户随意使用会很危险)
  2. 硬件指令法

    • TestAndSet指令

      简称TS指令,也有地方称为TestAndSetLock指令,或TSL指令TSL指令是用硬件实现的。TS是原子操作,执行的过程不允许被中断,只能一气呵成。以下是用C语言描述的逻辑。

      img

      相比软件实现方法,TSL 指令把 上锁和检查操作 用硬件的方式变成了一气呵成的 原子操作 。

      • 优点: 实现简单,无需像软件实现方法那样严格检查是否会有逻辑漏洞。适用于多处理机环境。
      • 缺点: 不满足 “让权等待” 原则,暂时无法进入临界区的进程会占用CPU并循环执行TSL指令,从而导致 忙等。
    • Swap指令

      有的地方也叫Exchange指令,或简称XCHG指令。Swp指令是用硬件实现的,是原子操作,执行的过程不允许被中断,只能一气呵成。

      img

    逻辑上来看 Swap 和 TSL 并无太大区别,都是先记录下此时临界区是否已经被上锁(记录在 old 变量上),再将上锁标记 lock 设置为 true,最后检查 old,如果 old 为 false 则说明之前没有别的进程对临界区上锁,则可跳出循环,进入临界区。Swap 指令优点缺点和TSL指令相同。

    • 硬件指令方法的优点
      • 适用于任意数目的进程,不管是单处理机还是多处理机;简单、容易验证其正确性。
      • 可以支持进程内有多个临界区,只需为每个临界区设立一个布尔变量。
    • 硬件指令方法的缺点
      • 进程等待进入临界区时要耗费处理时间,不能实现让权等待。
      • 从等待进程中随机选择一个进入临界区,有进程可能一直选不上,从而导致“饥饿”现象。

2.3.3 互斥锁

img

解决临界区最简单的工具就是互斥锁(mutex lock)。一个进程在进入临界区时获得锁;在退出临界区时释放锁。函数acquire()获得锁,而函数release()释放锁。acquire()和release()是原子操作,由硬件机制完成。

每个互斥锁有一个布尔变量available,表示锁是否可用。如果锁是可用的,调用acquire()会成功,且锁不再可用。当一个进程试图获取不可用的锁时,会被阻塞,直到锁被释放。

1
2
3
4
5
6
7
acquire(){
while(!available); //忙等待
avilable = false; //获得锁
}
release(){
available = true; //释放锁
}
  • 优点:等待期间不用切换进程上下文,多处理器系统中,若上锁的时间短,则等待代价很低
  • 缺点:需忙等,进程时间片用完才下处理机,违反“让权等待”;不太适用于单处理机系统,忙等的过程中不可能解锁

2.3.4 信号量

img

img

信号量机制是一种功能较强的机制,可用来解决互斥与同步问题,它只能被两个标准的原语wait(S)和signal(S)访问,也可记为”P操作”和”V操作”。

信号量其实就是一个变量(可以是一个整数,也可以是更复杂的记录型变量),可以用一个信号量来表示系统中某种资源的数量,比如:系统中只有一台打印机,就可以设置一个初值为1的信号量。

原语是一种特殊的程序段,其执行只能一气呵成,不可被中断。原语是由关中断/开中断指令实现的。软件解决方案的主要问题是由“进入区的各种操作无法一气呵成”,因此如果能把进入区、退出区的操作都用“原语”实现,使这些操作能“一气呵成”就能避免问题。

  1. 整型信号量

    用一个整数型的变量作为信号量,用来表示系统中某种资源的数量。wait(S)、signal(S)可描述为:

    img

    与普通整数变量的区别:对信号量的操作只有三种,即初始化、P操作、V操作

    wait(S) 原语,“检查”和“上锁”一气呵成,避免了并发、异步导致的问题。以申请使用打印机举例:

    img

    存在的问题: 不满足 “让权等待” 原则,会发生 忙等。

  2. 记录型信号量

    整型信号量存在“忙等”问题,因此人们又提出了“记录型信号量”,即用记录型数据结构表示的信号量。

    除了需要用于代表资源数目的整型变量value外,再增加一个进程链表L,用于链接所有等待该资源的进程。

    img

    • wait:如果剩余资源数不够使用block原语使进程从运行态进入阻塞态,并把挂到信号量S的等待队列(即阻塞队列)中。

    • signal:释放资源后,若还有别的进程在等待这种资源,则使用wakeup原语唤醒等待队列中的一个进程,该进程从阻塞态变为就绪态。

    • S.value的初值表示系统中某种资源的数目。

    • P操作:

      • 对信号量S的一次P操作意味着进程请求一个单位的该资源,因此需要执行S.value-,表示资源数减1
      • 当S.value<0时表示该类资源已分配完毕,因此进程应调用bock原语进行自我阻塞(当前运行的进程从运行态→阻塞态),主动放弃处理机,并插入该类资源的等待队列S.L中。
      • 可见,该机制遵循了“让权等待”原则,不会出现“忙等”现象。
    • V操作:

      对信号量S的一次V操作意味进程释放一个单位的该资源,因此需要执行S.value.+,表示资源数加1,

      • 若加1后仍是S.value<=0,表示依然有进程在等待该类资源,因此应调用wakeup原语唤醒等待队列中的第一个进程(被唤醒进程从阻塞态→就绪态)

    例:某计算机系统中有1台打印机,则可在初始化信号量 S 时将 S.value 的值设为 1,队列 S.L 设置为空。

    img

    ① CPU 为 P0 服务,S.value –,值为 0,P0开始使用打印机。
    ② CPU 为 P1 服务,S.value –,值为 -1,无资源执行 block 原语( wait原语 )。阻塞队列( P1 ),S.value = -1 说明有1个进程在等待资源。
    ③ CPU 为 P2 服务,S.value –,值为 -2,无资源执行 block 原语。阻塞队列( P1→P2 ),S.value = -2 说明有2个进程在等待资源。
    ④ CPU 为 P0 服务,S.value ++,S.value = -1 ≤ 0,说明有进程在等待该资源。因此应调用 wakeup 原语(signal原语)唤醒等待队列中的第一个进程P1,将释放资源给 P1,P1从阻塞态变为就绪态,等待被 CPU 服务(CPU顺序执行)。阻塞队列( P2 )
    ⑤ CPU 为 P1 服务,P1 使用完打印机,S.value ++,S.value = 0,调用 wakeup 原语唤醒 P2。阻塞队列()。
    ⑥ CPU 为 P2 服务, P2是用完打印机,S.value ++,S.value = 1。

  3. 信号量机制实现进程互斥

    img

    • 伪代码如下所示:

      设 S 为实现进程 P1、P2 互斥的信号量,由于只允许一个进程进入临界区,所以 S 的初值应设为 1。然后把临界区置于 P(S) 和 V(S) 之间,进入区之前申请资源(P操作),退出区之前释放资源( V操作 ),即可实现两个进程对临界资源的互斥访问。

      img

    • 操作:

      • 1.分析并发进程的关键活动,划定临界区(如:对临界资源打印机的访问就应放在临界区)
      • 2.设置互斥信号量mutex,初值为1
      • 3.在进入区P(mutex)一一申请资源
      • 4.在退出区V(mutex)一一释放资源
    • 注意

      • 对不同的临界资源需要设置不同的互斥信号量。
      • P、V操作必须成对出现。缺少P(mutex)就不能保证临界资源的互斥访问。缺少V(mutex)会导致资源永不被释放,等待进程永不被唤醒。
  4. 信号量机制实现进程同步

    img

    进程同步要让各并发进程按要求有序地推进。

    • 程序保证了代码4一定是在代码2之后执行。

    • 步骤:先V后P,后V前P

      • 1.分析什么地方需要实现“同步关系”,即必须保证“一前一后”执行的两个操作(或两句代码)
      • 2.设置同步信号量S,初始为0
      • 3.在“前操作”之后执行V(S)
      • 4.在“后操作”之前执行P(S)
    • 注意

      • 若先执行到V(S)操作,则S+后S=1。之后当执行到P(S)操作时,由于S=1,表示有可用资源,会执行S-,S的值变回0,P2进程不会执行block原语,而是继续往下执行代码4。
      • 若先执行到P(S)操作,由于S=0,S-后S=-1,表示此时没有可用资源,因此P操作中会执行bock原语,主动请求阻塞;当执行完代码2,继而执行V(S)操作,S+,使S变回0,由于此时有进程在该信号量对应的阻塞队列中,因此会在V操作中执行wakeup原语,唤醒P2进程。这样P2就可以继续执行代码4
  5. 信号量机制实现前驱关系

    img

    分析问题,画出前驱图,把每一对前驱关系都看成一个同步问题

    • 问题:下图是一个前驱图,其中 S1, S2, S3, … ,S6 是进程 P1, P2, P3,…, P6 中的程序段,这些程序段要求按如下前驱图所示的顺序来执行:

    • 操作:

      • 1.要为每一对前驱关系各设置一个同步信号量
      • 2.在“前操作”之后对相应的同步信号量执行V操作
      • 3.在“后操作”之前对相应的同步信号量执行P操作
  6. 同步、互斥信号量总结

    img

    注:互斥信号量初值一般为1,同步信号量的初始值要看对应资源的初始值是多少。

2.3.5 管程

img

  1. 引入管程原因

    管程的引入让程序员写程序时不需要再关注复杂的PV操作,从而避免了传统信号量机制存在的很多问题。

  2. 定义:由一组数据及定义在这组数据之上的对这组数据的操作组成的软件模块,这组操作能初始化并改变管程中的数据和同步进程。

  3. 管程的组成

    img

    • 局部于管程的共享数据结构说明
    • 对该数据结构进行操作的一组过程(函数)
    • 对局部于管程的共享数据设置初始值的语句
    • 管程的名字
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    monitor Demo{//定义一个名称为"Demo"的管程
    //定义共享数据结构,对应系统中的某种共享资源
    共享数据结构 S;
    //对共享数据结构初始化的语句
    init_code(){
    S=5; //初始资源数等于5
    }
    //过程1:申请一个资源
    take_away(){
    对共享数据结构x的一系列处理;
    s--; //可用资源-1
    ...
    }
    //过程2:归还一个资源
    give_back(){
    对共享数据结构x的一系列处理;
    s++; //可用资源+1
    ...
    }
    }
  4. 管程的基本特征

    • 局部于管程的数据只能被局部于管程的过程所访问
    • 一个进程只有通过调用管程内的过程才能进入管程访问共享数据
    • 每次仅允许一个进程在管程内执行某个内部过程

    注:过程其实就是函数,如下面这个 People 类,People 是管程的名字,username 和 str 是局部于管程的共享数据结构,login 方法是该数据结构进行操作的过程。

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    public class People{
    private String username = "admin"; // 用户名
    private String str= "123456"; // 密码

    public void login(){
    if("admin".equals(username) && "123456".equals(str)){
    System.out.println("登录成功!");
    }
    }
    }
  5. 条件变量

    条件变量condition,是表示管程阻塞原因的变量。

    通常,一个进程被阻塞的原因可以有多个,因此在管程中设置了多个条件变量。每个条件变量保存了一个等待队列,用于记录因该条件变量而阻塞的所有进程,对条件变量只能进行两种操作,即wait和signal。

    • x.wait:当x对应的条件不满足时,正在调用管程的进程调用x.wait将自己插入x条件的等待队列,并释放管程。此时其他进程可以使用该管程。
    • x.signal:x对应的条件发生了变化,则调用x.signal,唤醒一个因x条件而阻塞的进程。
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    monitor Demo{
    共享数据结构 S;
    condition x; //定义一个条件变量x
    init_code(){...}
    take_away(){
    if(S<0) x.wait(); //资源不够,在条件变量x上阻塞等待
    资源足够,分配资源,做一系列处理;
    }
    give_back(){
    归还资源,做一系列相应处理;
    if(有进程在等待)x.signal(); //唤醒一个阻塞进程
    }
    }
    • 条件变量和信号量的比较:
      • 相似点:条件变量的wait/signal操作类似于信号量的P/V操作,可以实现进程的阻塞/唤醒。
      • 不同点:条件变量是“没有值”的,仅实现了“排队等待”功能;而信号量是“有值”的,信号量的值反映了剩余资源数,而在管程中,剩余资源数用共享数据结构记录。

    img

img

2.3.6 经典同步问题

  1. 生产者-消费者问题

    • 问题描述

      系统中有一组生产者进程和一组消费者进程,生产者进程每次生产一个产品放入缓冲区,消费者进程每次从缓冲区中取出一个产品并使用。(注:这里的“产品”理解为某种数据)

      生产者、消费者共享一个初始为空、大小为n的缓冲区。

      • 只有缓冲区没满时,生产者才能把产品放入缓冲区,否则必须等待。
      • 只有缓冲区不空时,消费者才能从中取出产品,否则必须等待。

      缓冲区是临界资源,各进程必须互斥地访问。

    • 问题分析

      • 1.关系分析。找出题目中描述的各个进程,分析它们之间的同步、互斥关系。

        同步关系:缓冲区没满,生产者生产;缓冲区没空,消费者消费。

        互斥关系:各进程互斥访问缓冲区。

      • 2.整理思路。根据各进程的操作流程确定P、V操作的大致顺序。

        img

      • 3.设置信号量。并根据题目条件确定信号量初值。(互斥信号量初值一般为1,同步信号量的初始值要看对应资源的初始值是多少)

      1
      2
      3
      semaphore mutex = 1; //互斥信号量,实现对缓冲区的互斥访问
      semaphore empty = n; //同步信号量,表示空闲缓冲区的数量
      semaphore full = 0; //同步信号量,表示产品的数量,也即非空缓冲区的数量
    • 进程描述

      img

    • 能否改变相邻P、V操作的顺序?

      不能,会发生死锁

      img

      若此时缓冲区内已经放满产品,则 empty=0,full=n。则生产者进程执行 ① 使mutex变为0,再执行②,由于已没有空闲缓冲区,因此生产者被阻塞。由于生产者阻塞,因此切换回消费者进程。消费者进程执行 ③,由于 mutex 为 0,即生产者还没释放对临界资源的 “锁”,因此消费者也被阻塞。生产者和消费者循环等待被对方唤醒,出现 死锁。

      因此 实现互斥的 P 操作一定要在实现同步的 P 操作之后。

      V 操作不会导致进程阻塞,因此 两个 V 操作顺序可以交换。

    • 能否只设置一个同步信号量

      不能。原因在于:两个信号量 empty 和 full,其中 empty 用于制约生产者生产,full 用于制约消费者消费。如果只设置一个信号量,如 full,那么生产者会无限的生产,起不到制约作用。

  2. 多生产者多消费者问题

    • 问题描述

      桌子上有一只盘子,每次只能向其中放入一个水果。爸爸专向盘子中放苹果,妈妈专向盘子中放橘子,儿子专等着吃盘子中的橘子,女儿专等着吃盘子中的苹果。只有盘子空时,爸爸或妈妈才可向盘子中放一个水果。仅当盘子中有自己需要的水果时,儿子或女儿可以从盘子中取出水果。

    • 问题分析

      • 1.关系分析

        同步关系:① 父亲将苹果放入盘子,女儿才能取苹果;
             ② 母亲将句子放入盘子,儿子才能取橘子;
             ③ 只有盘子为空,父亲或者母亲才能放水果。
        互斥关系:对缓冲区(盘子)的访问要互斥的进行。

      • 2.整理思路

        img

        注:盘子为空这个事件可由儿子或者女儿触发,发生后父亲或母亲才可放水果。
        分析同步要以 事件 的角度分析,不要以 进程 的角度分析。

      • 3.信号量的设置

        1
        2
        3
        4
        semaphore mutex = 1;  //实现互斥访问盘子(缓冲区)
        semaphore apple = 0; //盘子中有几个苹果
        semaphore orange = 0; //盘子中有几个橘子
        semaphore plate = 1; //盘子中还可以放多少个水果
    • 进程描述

      img

    • 能否不用互斥信号量

      如果缓冲区大小为1,在任何时刻,apple、orange、plate 三个信号量中最多只有一个是1。因此在任何时刻,最多只有一个进程的P操作不会被阻塞,并顺利地进入临界区。
        如果缓冲区大小大于1,数据可能存在相互覆盖的情况。如:父亲在向盘子放橘子的同时,母亲也可以往盘子里放橘子,有可能导致两个进程写入缓冲区的数据相互覆盖的情况。
        因此,当缓冲区大小等于1,有可能不设置互斥变量。当缓冲区大小大于1,必须设置互斥变量。是否不用设置互斥信号量主要观察,同一时刻信号量是否最多一个1,建议设置互斥信号量。

      img

      但需要注意的是,实现互斥的P操作一定要在实现同步的P操作之后,否则可能引起“死锁”。

    • 分析

      在分析同步问题(一前一后问题)的时候不能从单个进程行为的角度来分析,要把“一前一后”发生的事看做是两种“事件”的前后关系。

      如果从 单个进程的角度 来考虑的话,会有以下结论:

      • ① 如果盘子里装有苹果,那么一定要女儿取走苹果后父亲或母亲才能再放入水果;
      • ② 如果盘子里装有橘子,那么一定要儿子取走橘子后父亲或母亲才能再放入水果。

      这就意味着要 设置四个同步信号量 分别实现这 四个一前一后的关系,较为复杂。

      img

      若从 事件的角度 来考虑,我们可以把上述四对进程行为的前后关系抽象为 一对事件 的前后关系,即:盘子变空事件 → 放入水果事件。

  3. 读者-写者问题

    • 问题描述

      有读者和写者两组并发进程,共享一个文件,当两个或两个以上的读进程同时访问共享数据时不会产生副作用,但若某个写进程和其他进程(读进程或写进程)同时访问共享数据时则可能导致数据不一致的错误。因此要求:

      • ①允许多个读者可以同时对文件执行读操作
      • ②只允许一个写者往文件中写信息
      • ③任一写者在完成写操作之前不允许其他读者或写者工作
      • ④写者执行写操作前,应让已有的读者和写者全部退出
    • 问题分析

      • 两类进程:写进程、读进程
      • 互斥关系:写进程一写进程、写进程一读进程。读进程与读进程不存在互斥问题

      img

    • 进程描述

      • 方案1

        方案设置 rw 和 mutex 两个信号量。rw 信号量 用于实现 读进程与写进程、写进程与写进程 对共享文件的互斥访问。mutex 信号量 用于保证对 count 变量的互斥访问。

        若没有设置 mutex 信号量,两个读进程并发执行到 if 条件且都满足,都会执行 P(rw),会造成其中一个读进程阻塞的情况。设置 mutex 信号量,使得 count 信号量的检查和赋值操作一气呵成,保证了对 count 信号量访问的互斥性。

        方案 1 存在的问题: 只要有读进程还在读,写进程就要一直阻塞等待,可能 “饿死”。因此,这种算法中,读进程是优先的。

      • 方案2

        方案 2 是对方案 1 问题的修正,添加了 w 信号量,保证了 读写公平 。如:假设对共享文件的访问顺序是:读者1→读者2→ 写者1 → 读者3 ,读者 2 执行完后,写者 1 将会进行写文件,读者 3 进程将会被阻塞。待写者1写完文件后,读者 3 进行读写者 1 访问后的文件。

        img

        算法 核心思想 在于设置了一个 计数器 count 用来记录当前正在访问共享文件的读进程数。我们可以用 count 的值来判断当前进入的进程是否是第一个/最后一个读进程,从而做出不同的处理。另外,还需考虑 count 变量的互斥性。

    • 结论

      在这种算法中,连续进入的多个读者可以同时读文件;写者和其他进程不能同时访问文件;写者不会饥饿,但也并不是真正的“写优先”,而是相对公平的先来先服务原则。

      有的书上把这种算法称为“读写公平法”

  4. 哲学家进餐问题

    • 问题描述

      一张圆桌上坐着5名哲学家,每两个哲学家之间的桌上摆一根筷子,桌子的中间是一碗米饭。哲学家们倾注毕生的精力用于思考和进餐,哲学家在思考时,并不影响他人。只有当哲学家饥饿时,才试图拿起左、右两根筷子(一根一根地拿起)。如果筷子已在他人手上,则需等待。饥饿的哲学家只有同时拿起两根筷子才可以开始进餐,当进餐完毕后,放下筷子继续思考。

    • 问题分析

      • 1.关系分析

        系统中有5个哲学家进程,5位哲学家与左右邻居对其中间筷子的访问是互斥关系。

      • 2.整理思路

        哲学家进餐问题中 只有互斥关系,但与之前遇到的问题不同点在于,每个哲学家进程需要同时持有两个临界资源才能开始吃饭。如何避免临界资源分配不当造成的死锁现象,是哲学家问题的关键。

      • 3.信号量的设置

        定义互斥信号量数组 chopstick[5]={1,1,1,1,1} 用于实现对 5 个筷子的互斥访问。并对哲学家按0~4编号,哲学家 i 左边的筷子编号为 i,右边的筷子编号为 (i+1)%5。此外,还需要设置 互斥信号量mutex,用以保证哲学家进程左右两支筷子都可用。

        img

    • 进程描述

      算法保证,一个哲学家再拿到筷子拿到一半时被阻塞,也不会有别的哲学家尝试拿筷子,即至少有一个哲学家进程不阻塞。

      img

      其他方案:
      ① 对哲学家进程施加一些限制条件,如最多允许四个哲学家同时进餐。这样可以保证至少有一个哲学家是可以拿到左右两只筷子的。
      ② 要求奇数号哲学家先拿左边的筷子,然后再拿右边的筷子,而偶数号哲学家刚好相反。用这种方法可以保证如果相邻的两个奇偶号哲学家都想吃饭,那么只会有其中一个可以拿起第一只筷子,另一个会直接阻塞。这就避免了占有一支后再等待另一只的情况。

  5. 吸烟者问题

    • 问题描述

      假设一个系统有 三个抽烟者进程 和 一个供应者进程。每个抽烟者不停地卷烟并抽掉它,但是要卷起并抽掉一支烟,抽烟者需要有三种材料:烟草、纸和胶水。三个抽烟者中,第一个拥有烟草、第二个拥有纸、第三个拥有胶水。供应者进程无限地提供三种材料,供应者每次将两种材料放桌子上,拥有剩下那种材料的抽烟者卷一根烟并抽掉它,并给供应者进程一个信号告诉完成了,供应者就会放另外两种材料在桌上,这个过程一直重复(让三个抽烟者轮流地抽烟)。

    • 问题分析

      • 1.关系分析

        同步关系:① 桌上有组合一,第一个抽烟者取走东西
             ② 桌上有组合二,第二个抽烟者取走东西
             ③ 桌上有组合三,第三个抽烟者取走东西
             ④ 抽烟者抽完发出完成信号,供应者将下一个组合放到桌上
        互斥关系:对缓冲区的访问要互斥的进行。

      • 2.整理思路

        img

        注:由于缓冲区大小为1,任意时刻同步信号量和互斥信号量最多只有一个1,因此互斥信号量可以不设置。

      img

      • 3.信号量的设置

        1
        2
        3
        4
        5
        semaphore offer1 = 0; //桌上组合一的数量
        semaphore offer2 = 0; //桌上组合二的数量
        semaphore offer3 = 0; //桌上组合三的数量
        semaphore finish = 0; //抽烟是否完成
        int i = 0; //用于实现“三个抽烟者轮流抽烟”
    • 进程描述

      img

    • 能否从进程角度思考?

      不可以。
        同多生产者多消费者问题,假设从进程角度思考,那么第一个抽烟者抽完后,供应者再将第一个组合放到桌上;第二个抽烟者抽完后,供应者再将第二个组合放到桌上;第三个抽烟者抽完后,供应者再将第三个组合放到桌上。这样相比于从事件考虑的一个一前一后的关系,多出了多个关系,并且较为复杂。因此要从事件的角度思考 PV 关系。

2.4 死锁

img

2.4.1 死锁的概念

  1. 死锁的定义

    在并发环境下,各进程因竞争资源而造成的一种互相等待对方手里的资源,导致各进程都阻塞,都无法向前推进的现象,就是“死锁”。发生死锁后若无外力干涉这些进程都将无法向前推进。

  2. 死锁、饥饿、死循环的区别

    img

    • 共同点:都是进程无法顺利向前推进的现象(故意设计的死循环除外)

    • 区别:

      • 死锁:各进程互相等待对方手里的资源,导致各进程都阻塞,无法向前推进的现象。两个以上程序

      • 饥饿:由于长期得不到想要的资源,某进程无法向前推进的现象。单个程序

        比如:在短进程优先(SPF)算法中,若有源源不断的短进程到来,则长进程将一直得不到处理机,从而发生长进程“饥饿”

      • 死循环:某进程执行过程中一直跳不出某个循环的现象。

        有时是因为程序逻辑bug导致的,有时是程序员故意设计的。

  3. 死锁产生原因

    • 对系统资源的竞争

      各进程对不可剥夺的资源(如打印机)的竞争可能引起死锁,对可剥夺的资源(CPU)的竞争是不会引起死锁的。

    • 进程推进顺序非法

      请求和释放资源的顺序不当,也同样会导致死锁。例如,并发执行的进程P1、P2分别申请并占有了资源R1、R2,之后进程P1又紧接着申请资源R2,而进程P2又申请资源R1,两者会因为申请的资源被对方占有而阻塞,从而发生死锁。

    • 信号量的使用不当也会造成死锁

      如生产者-消费者问题中,如果实现互斥的P操柞在实现同步的P操作之前,就有可能导致死锁。(可以把互斥信号量、同步信号量也看做是一种抽象的系统资源)

  4. 死锁产生的必要条件

    产生死锁 必须同时满足以下四个条件,只要其中任一条件不成立,死锁就不会发生。

    • ① 互斥条件:只有对必须 互斥使用的资源的争抢 才会导致死锁(如哲学家的筷子、打印机设备)。像内存、扬声器这样可以同时让多个进程使用的资源是不会导致死锁的(因为进程不用阻塞等待这种资源)。
    • ② 不剥夺条件:进程所获得的资源在未使用完之前,不能由其他进程强行夺走,只能主动释放。
    • ③ 请求和保持条件:进程已经 保持了至少一个资源,但又提出了新的资源请求,而该资源又被其他进程占有,此时请求进程被阻塞,但又对自己已有的资源保持不放。
    • ④ 循环等待条件:存在一种进程资源的 循环等待链,链中的每一个进程已获得的资源同时被下一个进程所请求。

    注:发生死锁时一定有循环等待,但是发生循环等待时未必死锁,即 循环等待是死锁的必要不充分条件。

    img

    如果同类资源数大于1,则即使有循环等待,也未必发生死锁(如上图 Pn 可以同时请求 P1 或者 Pk 的资源,得到 Pk 资源后,不会发生死锁)。 但如果系统中每类资源都只有一个,那循环等待就是死锁的充分必要条件了。

  5. 死锁处理策略

    • 死锁预防。设置某些限制条件,破坏产生死锁的4个必要条件中的一个或几个。
    • 避免死锁。在资源的动态分配过程中,用某种方法防止系统进入不安全状态。
    • 死锁的检测及解除。无须采取任何限制性措施,允许进程在运行过程中发生死锁。通过系统的检测机构及时地检测出死锁的发生,然后采取某种措施解除死锁。

    死锁的几种处理策略的比较见下表。

    资源分配策略 各种可能模式 主要优点 主要缺点
    死锁预防 保守,宁可资源闲置 一次请求所有资源,资源剥夺,资源按序分配 适用于突发式处理的进程,不必进行剥夺 效率低,进程初始化时间延长;剥夺次数过多;不便灵活申请新资源
    死锁避免 是“预防”和“检测”的折中(在运行时判断是否可能死锁) 寻找可能的安全允许顺序 不必进行剥夺 必须知道将来的资源需求;进程不能被长时间阻塞
    死锁检测 宽松,只要允许就分配资源 定期检查死锁是否已经发生 不延长进程初始化时间,允许对死锁进行现场处理 通过剥夺解除死锁,造成损失

2.4.2 死锁预防

死锁的产生必须满足四个必要条件,只要其中一个或者几个条件不满足,死锁不会发生。

  1. 破坏互斥条件

    img

    把只能互斥使用的资源改造为允许共享使用,则系统不会进入死锁状态。如: SPOOLing技术。使用 SPOOLing 技术可以把 独占设备在逻辑上改造成共享设备。比如,用SPOOLing技术将打印机改造为共享设备…

  2. 破坏不剥夺条件

    img

    • 提供两种方案:
      • ① 申请资源得不到时,主动释放所占有资源。
      • ② 申请资源被其他进程占用时,由 OS 协助剥夺。
    • 策略的缺点:
      • 实现起来比较复杂;
      • 释放已获得的资源可能造成前一阶段工作的失效,因此这种方法一般只适用于易保存和恢复状态的资源,如CPU;
      • 反复地申请和释放资源会增加系统开销,降低系统吞吐量;
      • 方案 ① 可能导致进程饥饿。
  3. 破坏请求和保持条件

    img

    采用 静态分配方法,即进程 在运行前一次申请完它所需要的全部资源,在它的资源未满足前,不让它投入运行。一旦投入运行后,这些资源就一直归它所有,该进程就不会再请求别的任何资源了。

    策略的缺点: 进程在整个运行期间都一直保持着所有资源,就会造成严重的资源浪费,资源利用率极低。另外,该策略也有 可能导致某些进程饥饿。

  4. 破坏循环等待条件

    img

    采用 顺序资源分配法。首先给系统中的资源编号,要求进程只能按编号递增顺序请求 资源。

    原理分析: 一个进程只有已占有小编号的资源时,才有资格申请更大编号的资源。按此规则,已持有大编号资源的进程不可能逆向地回来申请小编号的资源,从而就不会产生循环等待的现象(类比拓扑排序)。

    策略的缺点: 不方便增加新的设备,因为可能需要重新分配所有的编号;进程实际使用资源的顺序可能和编号递增顺序不一致,会导致资源浪费;必须按规定次序申请资源,用户编程麻烦。

2.4.3 死锁避免

死锁的避免是在资源动态分配过程中,防止系统进入不安全状态,以避免发生死锁。

  1. 系统安全状态

    img

    • 安全序列:是指如果系统按照这种序列分配资源,则每个进程都能顺利完成。
    • 安全状态:系统如果存在安全序列,则处于安全状态,安全状态一定不发生死锁。安全序列可能有多个。
    • 不安全状态:如果分配了资源之后,系统中找不出任何一个安全序列,系统就进入了不安全状态。可能发生死锁(处于不安全状态未必就是发生了死锁,但发生死锁时一定是在不安全状态)

    安全序列的计算方法:

    已知现有三个进程的资源分配表如下(可用代表系统还剩有 3 个资源),现假设可用资源每次分配都是全部分配,并且分配给进程的资源总数应满足进程最多还需求的资源数目(如:可用资源有 3 个,由于 P2 进程还需要 2 个资源,因此只能满足 P2),分配完后回收该进程所拥有的全部资源。

    img

    计算步骤如下:

    img

    因此得到安全序列是 {P2, P1, P3}。


    如果计算到 P3 时,可用资源无法满足 P3 的最大需求,即还需要的资源数目多于可用资源数目,那么就不存在安全序列。

    img

    注:死锁状态一定是不安全状态,不安全状态不一定是死锁状态,即:死锁状态 ⇒ 不安全状态。

    如:A 进程需 10 个资源,而可用资源有 5 个。若 A 还未提出申请,则不会进入死锁状态。

    系统进入不安全状态后,便可能进入死锁状态;反之,只要系统处于安全状态,系统变可避免进入死锁。

  2. 银行家算法

    img

    img

    img

    img

    核心思想: 在分配资源前,预先判断这次分配是否会导致系统进入不安全状态,以此来决定是否答应资源分配请求,从而使得系统避免死锁。

    • 数据结构描述:

      • ①可利用资源向量$Available$(一维数据)
      • ②最大需求矩阵$Max$
      • ③分配矩阵$Allocation$
      • ④需求矩阵$Need$

      其中,$Need=Max-Allocation$

      img

      注:$Available(A,B,C)=(3,3,2)$代表可用的 A 类资源数目有 3 个,B 类资源数目有3个,C 类资源数目有 2 个。

    • 银行家算法描述

      设$Request_i$是进程Pi的请求向量,$Request_i[j]=K$表示进程$Pi$需要$j$类资源$K$个。

      • ①若$Request_i[j]≤Need[i,j]$,检查此次申请是否超过最多还需求数。

      • ②若$Request_i[j]≤Available[j]$,检查系统的可用资源是否还能满足此次需求。

      • ③系统试探着把资源分配给$Pi$,并修改下面数据结构的数值:

        $Available=Available-Request_i$,修改i进程剩余可用资源数

        $Allocation[i,j]=Allocation[i,j]+Request_i[j]$,i进程已分配资源数加上本次请求资源数

        $Need[i,j]=Need[i,j]-Request_i[j]$,i进程还需的资源数减去本次请求的资源数

      • ④执行安全性算法,检查系统是否处于安全状态,即检查当前系统是否存在安全序列。

      若系统安全,才正式将资源分配给$Pi$;否则此次试探分配作废,恢复原来分配状态。

      注:安全性算法是银行家算法的核心。

    • 安全性算法描述

      设置工作向量$Work$,表示系统中剩余可用资源数目。算法执行开始时,$Work=Available$

      • ①初始时安全序列为空。
      • ②检查当前的剩余资源是否能满足某个进程的最大需求。如果可以就将它加入安全序列;若找不到执行步骤④
      • ③把该进程持有资源全部回收,返回步骤②
      • ④若此时安全序列中已有所有进程,则系统处于安全状态,否则处于不安全状态。
    • 例题

      假设当前系统中资源分配和剩余情况如下表所示,现$P1$发出请求向量$Request_1(1,0,2)$,判断此次请求是否分配成功。

      img

      • ① 系统按银行家算法进行检查:

        $Request_1(1,0,2)≤Need_1(1,2,2)$,$Request_1(1,0,2)≤Available(3,2,2)$

        此次申请未超过$P1$进程最多还需求数,并且当前可用资源数可满足此次申请,则可试探的为$P1$分配资源,并修改:

        $Available=Available-Request_1=(2,3,0)$
        $Allocation_1=Allocation_1+Request_1=(3,0,2)$
        $Need_1=Need_1-Request_1=(0,2,0)$

        img

      • ② 系统执行安全性算法检查安全状态:

        令$Work=Available=(2,3,0)$,执行安全性算法,如下表所示:

        img

        由安全性检查而知,可以找到一个安全序列 { P1, P3, P4, P0, P2 },因此系统是安全的,可以将P1所申请的资源分配给他。

2.4.4 死锁检测和解除

img

如果系统既不采取预防死锁的措施,也不采取避免死锁的措施,系统就很可能发生死锁。在这种情况下,系统应当提供死锁检测和解除的手段。

  1. 资源分配图

    系统死锁可利用 资源分配图 来描述。圆代表一个进程,框代表一类资源,框中一个圆代表一类资源中的一个资源。

    img

    • 两种结点:
      • 进程结点:对应一个进程
      • 资源结点:对应一类资源,一类资源可能有多个
    • 两种边:
      • 请求边:表示进程想申请几个资源(每条边代表一个)
      • 分配边:表示已经为进程分配了几个资源(每条边代表一个)
  2. 死锁定理

    简化资源分配图可检测系统状态是否为死锁状态。简化方法如下:

    ① 在资源分配图中,找出 既不阻塞又不是孤点的进程 Pi。

    • 不阻塞:表示进程申请的资源可以被满足,如 P1 进程。由于 R2 资源除分配给 P2 进程一个资源外,还剩有一个资源,因此 P1 进程申请的 R2 资源可以被满足。相反,P2 进程申请 R1 资源则不会被满足,由于 R1 资源全部被分配完。
    • 不是孤点:表示与该进程节点至少一个边相连。

    ② 消去进程所有的请求边和分配边,使之成为孤点。

    重复以上步骤,若能消去图中所有的边,则称该图是可完全简化的。

    img

    注:并不是系统中所有的进程都是死锁状态,用死锁检测算法 化简资源分配图后,还连着边的那些进程就是死锁进程。

    死锁定理:如果某时刻系统的资源分配图是不可完全简化的,那么此时系统死锁

  3. 死锁解除

    img

    一旦检测出死锁的发生,就应该立即解除死锁。解除死锁的主要方法有:

    • 资源剥夺法

      挂起(暂时放到外存上)某些死锁进程,并抢占它的资源,将这些资源分配给其他的死锁进程。但是 应防止被挂起的进程长时间得不到资源而饥饿。

    • 撤销进程法(或称终止进程法)

      强制撤销部分甚至全部死锁进程,并剥夺这些进程的资源。这种方式的优点是实现简单,但所付出的代价可能会很大。因为有些进程可能已经运行了很长时间,已经接近结束了,一旦被终止可谓功亏一篑,以后还得从头再来。撤销的原则可以按进程优先级和撤销进程代价的高低进行。

    • 进程回退法

      让一个或多个死锁进程回退到足以避免死锁的地步。进程回退时,自愿释放资源而非剥夺。这就要求系统要记录进程的历史信息,设置还原点。

    注:撤销进程法中参考的优先级,应考虑:进程优先级、已执行多长时间、还要多久能完成、进程已经使用了多少资源、进程是交互式的还是批处理式的等因素。