王道计算机考研 操作系统 —— 课程链接
2.1 进程与线程
2.1.1 进程的概念、组成、特征
进程的定义
程序:一个指令序列
程序和进程的区别:
程序(code)
:是静态的,就是个存放在磁盘里的可执行文件,就是一系列的指令集合
进程(Process)
:是动态的,是程序的一次执行过程
同一个程序多次执行会对应多个进程
从不同的角度,进程可以有不同的定义,比较传统典型的定义有:
- 进程是程序的一次执行过程。
- 进程是一个程序及其数据在处理机上顺序执行时所发生的活动。
- 进程是具有独立功能的程序在数据集合上运行的过程,它是系统进行资源分配和调度的一个独立单位
PCB(进程控制块)
进程控制块记录了操作系统所需的,用于描述进程的当前情况,以及控制进程运行的全部信息。操作系统是根据PCB来对并发执行的进程进行控制和管理的。
程序段、数据段、PCB三部分组成了进程实体(进程映像)
。一般情况下,我们把进程实体就简称为进程,例如,所谓创建进程,实质上是创建进程实体中的PCB;而撤销进程,实质上是撤销进程实体中的PCB。
引入进程实体的概念后,可把进程定义为:
进程
是进程实体
的运行过程,是系统进行资源分配和调度的一个独立单位。
注:严格来说,进程实体和进程并不一样,进程实体是静态的,进程则是动态的。不过,除非题目专门考察二者区别,否则可以认为进程实体就是进程。因此我们也可以说,进程由程序段、数据段、PCB三部分组成
注意:PCB是进程存在的唯一标志!
进程的组成
程序段、数据段、PCB 三部分组成了进程实体(进程映像)
引入进程实体的概念后,可把进程定义为:
进程是进程实体的运行过程,是系统进行资源分配和调度的一个独立单位。
PCB是进程存在的唯一标志,当进程被创建时,操作系统为其创建PCB,当进程结束时,会回收其PCB。
进程管理相关的数据存放在PCB
中
程序本身运行所需的数据存放在程序段\数据段
中
PCB 是给操作系统用的。
程序段、数据段是给进程自己用的
进程的组织
在一个系统中,通常有数十、数百乃至数千个PCB。为了能对他们加以有效的管理,应该用适当的方式把这些PCB组织起来。
注:进程的组成讨论的是一个进程内部由哪些部分构成的问题,而进程的组织讨论的是多个进程之间的组织方式问题
进程的特征
2.1.2 进程的状态
进程的状态
三种基本状态:
运行状态(Running)
:占CPU,并在CPU上运行
注意:在单核处理机环境下,每个时刻最多只有一个进程处于运行态就绪状态(Ready)
:已经具备运行条件,但由于没有空闲CPU,而暂时不能运行
就绪状态下,进程已经拥有了除CPU之外所有需要的资源,一旦获得处理机,即可进入运行态开始运行(万事俱备,只欠CPU)阻塞状态/等待态(Waiting/Blocked)
:因等待某一事件而暂时不能运行
如:等待操作系统分配打印机、等待读磁盘操作结果、等待另一个进程的运算结果。CPU是计算机中最昂贵的部件,为了提高CPU利用效率,需要将进程需要的其他资源分配到位,才能得到CPU的服务。
另外两种状态:
创建状态(New):进程正在被创建,操作系统为进程分配内存空间等系统资源、创建并初始化PCB。
终止状态(Terminated):进程运行结束,或由于bug导致进程无法继续执行(如数组越界),需要从系统中撤销进程,操作系统会回收被分配给进程的资源、撤销PCB。
进程状态间的转换
就绪态→运行态:进程被调度
运行态→ 就绪态:时间片到、或处理机被强占
运行态→阻塞态:进程用“系统调用”的方式申请某种系统资源,或者请求等待某个事件发生(进程自身的主动行为 , 如请求等待另一个进程的运算结果)
阻塞态 → 就绪态:申请的资源被分配,或者等待的事件发生(不是进程自身能控制的,是一种被动行为)
注意:不能由阻塞态直接转换为运行态,也不能由就绪态直接转换为阻塞态〈因为进入阻塞态是进程主动请求的,必然需要进程在运行时才能发出这种请求)
《现代操作系统》上的进程状态转换图:
2.1.3 进程控制
什么是进程控制
进程控制的主要功能是对系统中的所有进程实施有效的管理,它具有创建新进程、撤销已有进程、实现进程状态转换等功能
即:实现进程状态间转换的具体过程
如何让实现进程控制
用“原语”实现
原语
是一种特殊的程序,它的执行具有原子性
。也就是说,这段程序执行期间不可中断,必须一气呵成。这种不可中断的操作即原子操作
。
原语采用“关中断指令”
和“开中断指令”
实现
原语运行在核心态
,显然,关/开中断指令的权限非常大,必然是只允许在核心态下执行的特权指令
原语属于操作系统内核
的一部分(见1.1.4 操作系统运行机制和体系结构)
进程控制会导致进程状态的转换。无论哪个原语,要做的无非三类事情:
1.更新PCB中的信息(如修改进程状态标志、将运行环境保存到PCB、从PCB恢复运行环境)
a.所有的进程控制原语一定都会修改进程状态标志
b.剥夺当前运行进程的CPU使用权必然需要保存其运行环境c.某进程开始运行前必然要恢复期运行环境
2.将PCB插入合适的队列
3.分配/回收资源
进程的创建:创建原语
创建原语:无→创建态→就绪态
- 申请空白PCB
- 为新进程分配所需资源
- 初始化PCB
- 将PCB插入就绪队列
引起进程创建的事件
- 用户登录,分时系统中,用户登录成功,系统会建立为其建立一个新的进程
- 作业调度,多道批处理系统中,有新的作业放入内存时。会为其建立一个新的进程
- 提供服务,用户向操作系统提出某些请求时,会新建一个进程处理该请求
- 应用请求,由用户进程主动请求创建一个子进程
进程的终止:撤消原语
撤销原语:就绪态/阻塞态/运行态→终止态→无
- 从PCB集合中找到终止进程的PCB
- 若进程正在运行,立即剥夺CPU,将CPU分配给其他进程
- 终止其所有子进程
- 将该进程拥有的所有资源归还给父进程或操作系统
- 删除PCB
引起进程终止的事件:
6. 正常结束
7. 异常结束
8. 外界干预
进程的阻塞与唤醒:阻塞原语和唤醒原语
阻塞原语:运行态→阻塞态
- 找到要阻塞的进程对应的PCB
- 保护进程运行现场,将PCB状态信息设置为“阻塞态",暂时停止进程运行
- 将PCB插入相应事件的等待队列
引起进程阻塞的事件
- 需要等待系统分配某种资源
- 需要等待相互合作的其他进程完成工作
**唤醒原语:**阻塞态→就绪态
- 在事件等待队列中找到PCB
- 将PCB从等待队列移除,设置进程为就绪态
- 将PCB插入就绪队列,等待被调度
引起进程唤醒的事件:等待的事件发生
注意:进程由于何事阻塞,就应由于何事唤醒,因此阻塞原语和唤醒原语必须成对使用
进程的切换: 切换原语
切换原语:运行态→阻塞态/就绪态, 就绪态→运行态
- 将运行环境信息存入PCB
- PCB移入相应队列
- 选择另一个进程执行,并更新其PCB
- 根据PCB恢复新进程所需的运行环境
引起进程切换的事件
- 当前进程时间片到
- 有更高优先级的进程到达
- 当前进程主动阻塞
- 当前进程终止
2.1.4 进程通信
进程通信的概念和作用
进程通信
就是指进程之间的信息交换。
进程是分配系统资源的单位(包括内存地址空间),因此 各进程拥有的内存地址空间相互独立。为了保证安全,一个进程不能直接访问另一个进程的地址空间。但是进程之间的信息交换又是必须实现的。为了保证进程间的安全通信,操作系统提供了一些方法, 操作系统提供的进程通信方式分为共享存储
, 消息传递
, 管道通信
共享存储
两个进程不能直接访问对方的地址空间, 所以操作系统会为两个进程分配一个共享空间
, 两个进程的通信就可以通过共享空间来实现
注意:
- 两个进程对共享空间的访问必须是互斥的,互斥访问通过操作系统提供的工具实现
- 操作系统只负责提供共享空间和同步互斥工具(如P、V操作)
基于数据结构的共享
:比如共享空间里只能放一个长度为10的数组。这种共享方式速度慢、限制多(对于数据格式有限制),是一种低级通信方式
基于存储区的共享
:在内存中画出一块共享存储区,数据的形式、存放位置都由进程控制,而不是操作系统。相比之下,这种共享方式速度更快,是一种高级通信方式。
消息传递
进程间的数据交换以格式化的消息(Message)
为单位。进程通过操作系统提供的 发送消息/接收消息
两个原语
进行数据交换
消息
由消息头
和消息体
组成,
消息头
包括:发送进程ID、接受进程ID、消息类型、消息长度等格式化的信息(计算机网络中发送的“报文”其实就是一种格式化的消息)
消息传递分为两种:
直接通信方式
:消息直接挂到接收进程的消息缓冲队列上
间接通信方式
:消息要先发送到中间实体(信箱)中,因此也称“信箱通信方式”。Eg:计网中的电子邮件系统
管道通信
管道
是指用于连接读写进程的一个共享文件,又名pipe
文件。其实就是在内存中开辟一个大小固定的缓冲区
注意:
-
管道只能采用
半双工通信
(某一时间段内只能实现单向的传输)。如果要实现双向同时通信
,则需要设置两个管道。 -
各个进程要互斥的访问管道。
-
数据以字符流的形式写入管道,当管道写满时,写进程的write()系统调用将被阻塞,等待读进程将数据取走。当读进程将数据全部取走后,管道变空,此时读进程的read()系统调用将被阻塞。
-
数据一旦被读出,就从管道中被抛弃,这就意味着读进程最多只能有一个,否则可能会有读错数据的情况。
2.1.5 线程概念和多线程模型
线程的概念和作用
- 什么是线程,为什么要引入线程?
还没引入进程之前,系统中各个程序只能串行执行。
引入进程后,进程是程序的一次执行。实际情况中, 一些功能显然需要用不同的几段程序才能实现,如用QQ同时进行视频、文字聊天和传送文件,并且这几段程序还要并发运行。
有的进程可能需要“同时”(宏观上)做很多事,而传统的进程只能串行地执行一系列程序。为此,引入了“线程”,来增加并发度,一个进程可以包含多个并发的线程。
引入线程后,线程成为了程序执行流的最小单位。进程依然是资源分配的基本单位。从属于同一进程的各个线程共享进程的资源。
可以把线程理解为“轻量级进程”。线程是一个基本的CPU执行单元,也是程序执行流的最小单位。
引入线程之后,不仅是进程之间可以并发,进程内的各线程之间也可以并发,从而进一步提升了系统的并发度,使得一个进程内也可以并发处理各种任务(如QQ视频、文字聊天、传文件)
引入线程后,进程只作为除CPU之外的系统资源的分配单元(如打印机、内存地址空间等都是分配给进程的)。
- 引入线程机制后,有什么变化?
① 资源的分配、调度:
传统进程机制中,进程是资源分配、调度的基本单位;引入线程后,进程是资源分配的基本单位,线程是调度的基本单位
② 并发性:
传统进程机制中,只能进程间并发;引入线程后,各线程间也能并发,提升了并发度
③ 系统开销:
传统的进程间并发,需要切换进程的运行环境
,系统开销很大;线程间并发,如果是同一进程内的线程切换,则不需要切换进程环境,系统开销小,引入线程后,并发所带来的系统开销减小
线程的属性
- 线程是处理机调度的单位
- 多CPU计算机中,各个线程可占用不同的CPU
- 每个线程都有一个
线程ID
、线程控制块(TCB)
- 线程也有
就绪
、阻塞
、运行
三种基本状态 - 线程几乎不拥有系统资源
- 同一进程的不同线程间共享进程的资源
- 由于共享
内存地址空间
,同一进程中的线程间通信甚至无需系统干预 - 同一进程中的线程切换,不会引起进程切换
- 不同进程中的线程切换,会引起进程切换
- 切换同进程内的线程,系统开销很小
- 切换进程,系统开销较大
线程的实现方式
-
用户级线程 (User-Level Thread, ULT)
用户级线程由应用程序通过线程库
实现。所有的线程管理工作都由应用程序负责(包括线程切换)
用户级线程中,线程切换
可以在用户态
下即可完成,无需操作系统干预(无需切换到核心态)。
在用户看来,是有多个线程。但是在操作系统内核看来,并意识不到线程的存在。用户级线程对用户不透明,对操作系统透明
可以这样理解,“用户级线程”就是 “从用户视角看能看到的线程”
-
内核级线程
内核级线程
的管理工作由操作系统内核
完成。线程调度、切换等工作都由内核负责,因此内核级线程的切换必然需要在核心态
下才能完成。
可以这样理解,“内核级线程”就是 “从操作系统内核视角看能看到的线程”
在同时支持用户级线程和内核级线程的系统中,可采用二者组合的方式:将n个用户级线程映射到m
个内核级线程上( n >= m)
注意: 操作系统只“看得见”内核级线程,因此只有内核级线程才是处理机分配的单位。
例如:左边这个模型中,该进程由两个内核级线程,三个用户级线程,在用户看来,这个进程中有三个线程。但即使该进程在一个4核处理机的计算机上运行,也最多只能被分配到两个核,最多只能有两个用户线程并行执行
多线程模型
在同时支持用户级线程和内核级线程的系统中,由几个用户级线程映射到几个内核级线程的问题引出了“多线程模型”问题。
多线程模型:用户n >= 核心m
1. 多对一模型
多对一模型:多个用户及线程映射到一个内核级线程。每个用户进程只对应一个内核级线程。
优点:用户级线程的切换在用户空间
即可完成,不需要切换到核心态
,线程管理的系统开销小,效率高
缺点:当一个用户级线程被阻塞后,整个进程都会被阻塞,并发度不高。多个线程不可在多核处理机上并行运行
2. 一对一模型
一对一模型:一个用户及线程映射到一个内核级线程。每个用户进程有与用户级线程同数量的内核级线程。
优点:当一个线程被阻塞后,别的线程还可以继续执行,并发能力强。多线程可在多核处理机上并行执行
。
缺点:一个用户进程会占用多个内核级线程
,线程切换由操作系统内核
完成,需要切换到核心态
,因此线程管理的成本高,开销大。
3. 多对多模型
多对多模型:n用户及线程映射到m 个内核级线程(n >= m) 。每个用户进程对应m个内核级线程。
克服了多对一模型并发度不高的缺点,又克服了一对一模型中一个用户进程占用太多内核级线程,开销太大的缺点。
文章评论