Linux高性能服务器编程 System V IPC信号量和POSIX信号量详解
System V IPC信号量和POSIX信号量详解
1.System V IPC信号量
1.信号量原语
多个进程同时访问系统上某个资源时,如同时写一个数据库的某条记录,或同时修改某个文件,就需要考虑进程同步问题,以确保任一时刻只有一个进程可以拥有对资源的独占式访问。通常,进程对共享资源的访问的代码只是很短的一段**,但这段代码引发了进程之间的竞态条件,我们称这段代码为关键代码区,或临界区,对进程同步,就是确保任一时刻只有一个进程能进入关键代码段。**
Dekker算法和Peterson算法试图从语言本身(不需要内核支持)解决进程同步问题,但它们依赖于忙等待,即进程要持续不断地等待某个内存位置状态的改变,这种方式的CPU利用率太低,不可取。
Dijkstra提出的信号量(Semaphore)是一种特殊的变量,它只能取自然数值且只支持两种操作:等待(wait)和信号(signal)。但在Linux/UNIX中,等待和信号都已经具有特殊含义,所以对信号量的这两种操作更常用的称呼是P、V操作,这两个字母来自荷兰语单词passeren(传递,就好像进入临界区)和vrijgeven(释放,就好像退出临界区)。
假设有信号量SV,对它的P、V操作含义如下:
- P(SV),如果SV的值大于0,就将它减1,如果SV的值为0,则挂起进程的执行。
- V(SV),如果有其他进程因为等待SV而挂起,则唤醒之,如果没有,则将SV加1。
信号量的取值可以是任何自然数,但最常用的、最简单的信号量是二进制信号量,它只能取0或1两个值,我们仅讨论二进制信号量。使用二进制信号量同步两个进程,以确保关键代码段的独占式访问的例子:
上图中,当关键代码段可用时,二进制信号量SV的值为1,进程A和B都有机会进入关键代码段,如果此时进程A执行了P(SV)操作将SV减1,则进程B再执行P(SV)操作就会被挂起,直到进程A离开关键代码段,并执行V(SV)操作将SV加1,关键代码段才重新变得可用。
不能使用普通变量来模拟二进制信号量,因为所有高级语言都没有一个原子操作可以同时完成以下两步操作:检测变量是否为true/false,如果是则将它设置为false/true。
Linux信号量的API定义在sys/sem.h
头文件中,主要包括3个系统调用:semget
、semop
、semctl
。它们被设计为操作一组信号量,即信号量集,而不是单个信号量。
2.semget
系统调用
semget
系统调用创建一个新的信号量集,或获取一个已经存在的信号量集。
1 |
|
参数
key
:键值,用来标志全局唯一的信号量集,要通过信号量通信的进程需要使用相同的键值来创建/获取该信号量。
num_sems
:指定要创建/获取的信号量集中信号量的数目,如果是创建信号量,该值必须指定,如果是获取已经存在的信号量,该值可以设置为0。
sem_flags
:指定一组标志,低端的9个bite是信号量的权限,格式和含义与open
的mode
参数一致。此外,它可以和IPC_CREAT
标志做按位或运算以创建新的信号量集。还可以联合使用IPC_CREAT
和IPC_EXCL
标志确保创建新的、唯一的信号量集,如果这时候该信号量集已经存在,semget
返回错误并设置errno为EEXIST
。
返回值
semget
成功返回一个正整数,也就是信号量集的标识符,失败返回-1并设置errno。
如果用semget
创建一个新的信号量集,与之相关的内核数据结构体semid_ds
将被创建并初始化。
1 | struct semid_ds { |
3.semop
系统调用
semop
系统调用改变信号量的值,即执行P、V操作,在讨论semop
函数前,先介绍与每个信号量关联的一些重要的内核变量:
1 | unsigned short semval; /* 信号量的值 */ |
semop
函数对信号量的操作实际就是改变上述内核变量的操作,该函数定义如下:
1 |
|
参数
sem_id
:semget
调用返回的信号量集标识符,指定被操作的目标信号量集。
sem_ops
:指向一个 sembuf
类型结构体的数组:
1 | struct sembuf |
sem_num
:信号量集中信号量的编号,0代表信号量集的第一个信号量,以此类推。sem_op
:指定操作类型,可选值:正整数,0、负整数,同时受到sem_flg
的影响。op>0执行V操作,op小于0执行P操作- 通常
P
操作值为 - 1,V
操作值为 1
- 通常
sem_flg
:可选值为IPC_NOWAIT
,SEM_UNDO
,0
。IPC_NOWAIT
代表非阻塞操作,SEM_UNDO
代表撤销操作,0代表阻塞操作- 当
sem_flg
设置为IPC_NOWAIT
时,如果信号量操作(如sem_op
中的减法操作使得信号量的值小于 0)不能立即执行,操作不会阻塞等待信号量状态改变,而是立即返回一个错误,错误码通常为EAGAIN
。这种方式适用于不希望进程在信号量操作上长时间阻塞的场景,例如在一些对实时性要求较高的应用中,当获取不到信号量时可以先去执行其他任务。 - 当
sem_flg
设置为SEM_UNDO
时,系统会记录信号量操作,以便在进程异常终止时自动撤销(调整)信号量的值,以避免信号量状态被错误地锁定或者资源无法释放的情况。例如,如果一个进程对信号量进行了P
操作(减操作)获取资源后异常终止,没有来得及进行V
操作(加操作)释放资源,设置了SEM_UNDO
的信号量系统会自动进行适当的调整,保证信号量状态的正确性。 - 当
sem_flg
为 0 时,信号量操作会按照正常的阻塞方式执行。对于P
操作(sem_op
为负数),如果信号量的值不够减,进程会被阻塞,直到信号量的值满足操作要求(例如其他进程进行了V
操作增加了信号量的值)。这种方式在需要确保资源按照顺序被访问和操作,且允许进程等待资源可用的场景下非常有用,比如在经典的生产者 - 消费者模型中,消费者进程等待生产者生产出产品(通过信号量控制),此时使用阻塞式操作可以保证消费者在没有产品时等待,直到生产者生产出产品后再继续执行。
num_sem_ops
:指定要执行的操作个数,即sem_ops
数组中元素的个数。semop
函数对sem_ops
数组参数中的每个成员按数组顺序依次执行操作,且该过程是原子操作,以避免别的进程在同一时刻按不同顺序对该信号集中的信号量执行semop
函数导致的竞态条件。
返回值
semop
成功返回0,失败返回-1并设置errno。
sem_op值的不同操作规则:
- 当
sem_op
大于 0 时,表示进程要增加信号量的值。操作要求调用进程对被操作信号量集拥有写权限。若设置了SEM_UNDO
标志,系统将更新进程的semadj
变量。 - 当
sem_op
等于 0 时,表示这是一个 “等待 0” 操作。操作要求调用进程对被操作信号量集拥有读权限。如果信号量的值为 0,调用立即成功;如果不是 0,则操作失败或阻塞进程直到信号量变为 0。在这种情况下,当IPC_NOWAIT
标志被指定时,操作立即返回一个错误,并设置errno
为EAGAIN
。若未指定IPC_NOWAIT
标志,信号量的semncnt
值加 1,进程将被投入睡眠直到满足特定条件。 - 当
sem_op
小于 0 时,表示对信号量值进行减操作,即期望获得信号量。操作要求调用进程对被操作信号量集拥有写权限。如果信号量的值semval
大于或等于sem_op
的绝对值,操作成功,调用进程立即获得信号量,并且系统将该信号量的semval
值减去sem_op
的绝对值。若设置了SEM_UNDO
标志,则系统将更新进程的semadj
变量。
4.semctl
系统调用
semctl
系统调用允许调用者对信号量进行直接控制:
1 |
|
参数:
sem_id
参数是由semget
调用返回的信号量集标识符,用于指定被操作的信号量集。sem_num
参数指定被操作的信号量在信号量集中的编号。command
参数指定要执行的命令,有些命令需要调用者传递第 4 个参数。
第四个参数可以自定义,但是系统给出了推荐的定义格式:
1 | union semun |
1 | struct seminfo |
返回值:
semctl
成功时的返回值取决于command
参数,失败时返回 - 1,并设置errno
。
注意事项
在GETNCNT
、GETPID
、GETVAL
、GETZCNT
和SETVAL
操作中,操作的是单个信号量,此时sem_num
参数指定单个信号量在信号量集中的编号。而其他操作针对的是整个信号量集,此时sem_num
参数被忽略。
5.特殊键值 IPC_PRIVATE
semget
的调用者可以给其key
参数传递一个特殊键值IPC_PRIVATE
(其值为0),这样无论该信号量是否已存在,semget
函数都将创建一个新信号量,使用该键值创建的信号量并非像它的名字声称的那样是进程私有的,其他进程,尤其是子进程,也有方法来访问这个信号量,所以semget
函数的man手册的BUGS部分上说,使用名字IPC_PRIVATE
有些误导(历史原因),应称为IPC_NEW
。
6.信号量实现进程间通信
1 |
|
1. 数据结构定义
定义了ListNode
结构体来表示链表的节点,包含一个int
类型的数据成员用于存放生产者生产的数据,以及一个指向下一个节点的指针成员。
2. 信号量操作相关部分
union semun
结构体:用于给semctl
函数传递参数,根据不同的命令可以传递不同类型的值,在这里主要用于初始化信号量的值。semaphore_op
函数:封装了semop
函数,用于对信号量进行操作。它接受信号量集标识符、信号量编号以及操作值作为参数,构造struct sembuf
结构体并调用semop
函数来执行信号量操作,操作失败时会输出错误信息并终止程序。
3. 生产者逻辑
- 在
producer
函数中,首先定义了链表头指针head
,并在循环中不断生产数据。每次生产时,先通过malloc
函数申请一个新的链表节点内存空间,将数据存入节点。 - 然后通过
semaphore_op
函数获取空闲缓冲区信号量(这里代表链表中可插入新节点的空位),接着将新节点插入到链表头部(简单实现了链表插入操作,实际可根据需求调整插入逻辑),再通过semaphore_op
函数增加产品信号量,表示链表中有新的数据可供消费者消费,最后通过sleep
函数模拟生产过程的时间间隔。
4. 消费者逻辑
- 在
consumer
函数中,通过循环不断尝试消费数据。首先通过semaphore_op
函数获取产品信号量,只有当链表中有数据(信号量值大于等于 1)时才能继续执行。 - 接着取出链表头节点,将其数据打印出来模拟消费过程,然后释放该节点占用的内存空间,最后通过
semaphore_op
函数增加空闲缓冲区信号量,表示链表腾出了一个空位可供生产者插入新节点,同样通过sleep
函数模拟消费过程的时间间隔。
5. 主函数部分
- 在
main
函数中,通过semget
函数创建包含两个信号量的信号量集,分别用于控制空闲缓冲区(链表插入空位)和产品(链表中可消费的数据)。 - 使用
semctl
函数结合union semun
结构体来初始化这两个信号量的初始值。 - 通过
fork
函数创建子进程,子进程执行consumer
函数作为消费者,父进程执行producer
函数作为生产者。 - 最后在程序结束时,通过
semctl
函数删除信号量集,释放相关系统资源。
这样就通过 System V IPC 信号量实现了一个基于链表作为共享数据结构的生产者 - 消费者模型,确保了生产者和消费者对链表的并发访问是安全有序的。
运行结果:
2.POSIX信号量
1.概述
在Linux上,信号量API有两组,一组是System V IPC信号量(信号量),另一组是我们要讨论的POSIX信号量。这两组接口很相似,且语义完全相同,但不保证能互换。
进化版的互斥锁(1 –> N)
由于互斥锁的粒度比较大,如果我们希望在多个线程间对某一对象的部分数据进行共享,使用互斥锁是没有办
法实现的,只能将整个数据对象锁住。这样虽然达到了多线程操作共享数据时保证数据正确性的目的,却无形中导
致线程的并发性下降。线程从并行执行,变成了串行执行。与直接使用单进程无异。
信号量,是相对折中的一种处理方式,既能保证同步,数据不混乱,又能提高线程并发
POSIX信号量函数的名字都以sem_
开头,不像大多线程函数那样以pthread_
开头。常用的POSIX信号量函数如下:
1 |
|
上图中函数的第一个参数sem
指向被操作的信号量。
sem_init
函数用于初始化一个未命名信号量(POSIX信号量API支持命名信号量,但本书不讨论)。pshared
参数指定信号量类型,如果值为0,就表示这个信号量是当前进程的局部信号量,否则该信号量可以在多个进程间共享。value
参数指定信号量的初始值。初始化一个已经被初始化的信号量将导致不可预期的结果。sem_destroy
函数用于销毁信号量,以释放其占用的内核资源,销毁一个正被其他线程等待的信号量将导致不可预期的结果。sem_wait
函数以原子操作的方式将信号量的值减1,如果信号量的值为0,则sem_wait
函数将被阻塞,直到这个信号量具有非0值。sem_trywait
函数与sem_wait
函数类似,但它始终立即返回,而不论被操作的信号量是否具有非0值,相当于sem_wait
函数的非阻塞版本。当信号量非0时,sem_trywait
函数对信号量执行减1操作,当信号量的值为0时,该函数返回-1并设置errno为EAGAIN
。sem_post
函数以原子操作的方式将信号量的值加1,当信号量的值从0变为1时,其他正在调用sem_wait
等待信号量的线程将被唤醒。
上图中的函数成功时返回0,失败则返回-1并设置errno。
2.对应函数
1.总览
1 |
|
以上 6 个函数的返回值都是:成功返回 0, 失败返回-1,同时设置 errno。(注意,它们没有 pthread 前缀)
sem_t 类型,本质仍是结构体。但应用期间可简单看作为整数,忽略实现细节(类似于使用文件描述符)。
规定信号量 sem 不能 < 0。
信号量基本操作:
sem_wait:
1.信号量大于 0,则信号量– (类比 pthread_mutex_lock)
2.信号量等于 0,造成线程阻塞
对应
sem_post:
将信号量++,同时唤醒阻塞在信号量上的线程 (类比 pthread_mutex_unlock)
但,由于 sem_t 的实现对用户隐藏,所以所谓的++、–操作只能通过函数来实现,而不能直接++、–符号。
信号量的初值,决定了占用信号量的线程的个数。
2.初始化和销毁
初始化一个信号量
1 | int sem_init(sem_t *sem, int pshared, unsigned int value); |
参 1:sem 信号量
参 2:pshared 取 0 用于线程间;取非 0(一般为 1)用于进程间
参 3:value 指定信号量初值
sem_destroy 函数
销毁一个信号量
1 | int sem_destroy(sem_t *sem); |
3.PV操作主要函数
sem_wait 函数
给信号量加锁 –
1 | int sem_wait(sem_t *sem); |
sem_post 函数
给信号量解锁 ++
1 | int sem_post(sem_t *sem); |
sem_trywait 函数
尝试对信号量加锁 – (与 sem_wait 的区别类比 lock 和 trylock)
1 | int sem_trywait(sem_t *sem); |
sem_timedwait 函数
限时尝试对信号量加锁 –
1 | int sem_timedwait(sem_t *sem, const struct timespec *abs_timeout); |
参 2:abs_timeout 采用的是绝对时间。
1 | 定时 1 秒: |
3.实现生产者消费者
流程
完整代码
1 | /*信号量实现 生产者 消费者问题*/ |