操作系统知识笔记总结

Posted Aug 19, 2023 Updated May 2, 2024

By 😇 104 min read

Overview

操作系统的四大特性

并发：同一时段内多个程序执行
共享：系统中的资源可以被内存中多个并发执行的进线程共同使用
虚拟：通过时分复用（比如分时系统）以及空分复用（比如虚拟内存）技术实现把一个物理实体虚拟为多个
异步：系统中的进程是以走走停停的方式执行的，且以一种不可预知的速度推进

操作系统基本功能

进程管理：进程控制、进程同步、进程通信、死锁处理、处理机调度等
内存管理：内存分配、地址映射、内存保护与共享、虚拟内存等
文件管理：文件存储空间的管理、目录管理、文件读写管理和保护等
设备管理：完成用户的 I/O 请求，方便用户使用各种设备，并提高设备的利用率。主要包括缓冲管理、设备分配、设备处理、虚拟设备等。

CPU 中央处理器

CPU Central processing unit 中央处理器
进程是计算机中的程序关于某数据集合上的一次运行活动，是系统进行资源分配和调度的基本单位，是操作系统结构的基础。
资源分配的最小单位是进程，而 CPU 调度的最小单位是时间片
系统为进程分配资源，不对线程分配资源

CPU 调度

高级调度（作业调度）
1. 多道批处理操作系统中，从输入系统的一批作业中按照预定的调度策略挑选若干作业进入内存，为其分配资源并创建对应的作业用户进程
2. 作业是任务实体，进程是完成任务的执行实体。作业的概念多用于批处理操作系统，而进程用于各种多道程序设计系统。
中级调度
1. 根据内存资源情况决定内存中所能容纳的进程数目，并完成外存和内存中的进程兑换工作（挂起）。起到短期均衡系统负载的作业
低级调度（进程调度/线程调度）
1. 根据某种原则决定就绪队列中哪个进程/线程获得处理器，并让处理器出让给他使用

Q 某一进程 CPU 使用率 50% 是什么意思？

CPU 使用率是来描述CPU的使用情况的，表明了一段时间内CPU被占用的情况。使用率越高，说明你的及其在这个时间上运行了很多程序，反之较少。使用率的高低与你的CPU强弱有直接关系。
CPU的占用率，一般指的就是对时间片的占用情况，CPU: 50%说明 CPU 有一半的时间在运行，一半的时间在休息（100ms中50ms被进程占用，50ms处于空闲状态）

Q 如何让CPU使用率固定在50？【仅限于单核CPU】

CPU 的占有率是由进程的忙和空闲来决定的，即 \(\text{rate} = \frac{\text{busy\_time}}{\text{busy\_time} + \text{idle\_time}}\)
让 CPU 使用率固定在 50%，只要让计算机有一半的时间在运行，一半的时间在休息就可以了。
busy 可以用循环（这个循环用空循环，以便好控制），idle 可以用 sleep，比如先让任务管理器的 CPU 使用率始终保持在 50% 左右，那么在一个主循环中，让空循环和 sleep 运行同样的一小段时间，sleep 的时间好搞，空循环怎么办？可以在运行的时候设定空循环的运行时间。

  
public static void main(String args[]) throws InterruptedException {
    int busyTime = 10;
    int idleTime = busyTime;
    // 设置空循环的运行时间
    while (true) {
        long startTime = System.currentTimeMillis();
        // busy loop
        while (System.currentTimeMillis() - startTime)
            ;
        Thread.sleep(idleTime);
    }
}

用户态 & 内核态

概念解释

用户态：用户态运行的进程可以直接读取用户程序的数据。
内核态：内核态运行的进程或程序几乎可以访问计算机的任何资源，不受限制。

二者区别

两者最重要的差别就在于特权级的不同，即权力的不同。运行在用户态下的程序不能直接访问操作系统内核数据结构和程序。当我们在系统中执行一个程序时，大部分时间是运行在用户态下的，在其需要操作系统帮助完成某些它没有权力和能力完成的工作时就会切换到内核态

用户态切换到内核态的 3 种方式

系统调用：这是用户态进程主动要求切换到内核态的一种方式，用户态进程通过系统调用申请使用操作系统提供的服务程序完成工作。而系统调用的机制其核心还是使用了操作系统为用户特别开放的一个中断来实现
异常：当 CPU 在执行运行在用户态下的程序时，发生了某些事先不可知的异常，这时会触发由当前运行进程切换到处理此异常的内核相关程序中，也就转到了内核态，比如缺页异常
外围设备的中断：当外围设备完成用户请求的操作后，会向 CPU 发出相应的中断信号，这时 CPU 会暂停执行下一条即将要执行的指令转而去执行与中断信号对应的处理程序，如果先前执行的指令是用户态下的程序，那么这个转换的过程自然也就发生了由用户态到内核态的切换。（比如硬盘读写操作完成，系统会切换到硬盘读写的中断处理程序中执行后续操作等。）

系统调度

Q 什么是系统调用？

Ans 我们运行的程序基本都是运行在用户态，如果需要调用操作系统提供的系统态级别的子功能，就需要系统调用。也就是说在我们运行的用户程序中，凡是与系统态级别的资源有关的操作（如文件管理、进程控制、内存管理等)，都必须通过系统调用方式向操作系统提出服务请求，并由操作系统代为完成

常见的系统调用

设备管理	完成设备的请求或释放，以及设备启动等功能
文件管理	完成文件的读、写、创建及删除等功能
进程控制	完成进程的创建、撤销、阻塞及唤醒等功能
进程通信	完成进程之间的消息传递或信号传递等功能
内存管理	完成内存的分配、回收以及获取作业占用内存区大小及地址等功能

CPU 如何访问内存

CPU 正是通过内存地址来访问内存的。这个地址本质上是一个整数数据。而这个整数代表了一个内存单元的索引号，CPU 访问内存的时候，硬件的地址译码器会负责把索引号，转换成相应的地址信号和片选信号，帮助CPU“寻路”，找到特定的内存单元位置。

CPU 发出的虚拟地址经过MMU转换出物理地址，进而访问内存的过程，但我们并没有弄清楚MMU是使用什么方法进行转换的，所以下面我们继续探讨MMU的地址转换过程。

你不妨想一想，把一个数据转换成另一个数据，最简单的方案是什么？当然是建立一个对应表格，对照表格进行查询就行了。MMU也是使用一个地址转换表，但是它做很多优化和折中处理。不做任何折中处理的话，这种方案是无法实施的。

你可以想象一下32位的地址空间，有4G个虚拟地址和4G个物理地址。在这种情况下，每8个字节存放两个地址数据，想要装下所有的地址，这个表有多大？应该放在哪里？查询代价有多大？所以这个方案直接pass掉。

我们现在来看看，通常情况下MMU是如何解决这个问题的，一共有三个关键环节。

首先，MMU对虚拟地址空间和物理地址空间进行 分页处理，一个页大小可以是 4KB、16KB、2MB、4MB、1GB 不等。这是为了增加地址的粒度，避免采用每个字节一个地址，现在一页一个地址，地址数量就会大大减少，从而减少转换表的大小。

其次，MMU采用的转换表也称为页表，其中只会对应物理页地址，不会储存虚拟地址，而是 将虚拟地址作为页表索引，这进一步缩小了页表的大小。

最后MMU 对页表本身进行了拆分，变成了多级页表。假如不分级，4GB内存空间，按照4KB大小分页，有1M个页表项，每个页表项只占用4个字节，也需要4MB空间。如果页表分级，在建立页表时就可以按需建立页表，而不是一次建立4MB大小的页表。

Memory 内存

内存的内部是由各种IC电路组成的，它的种类很庞大，但是其主要分为三种存储器：

集成电路（integrated circuit）

随机存储器（RAM）：内存中最重要的一种，表示既可以从中读取数据，也可以写入数据，当机器关闭时，内存中的信息会丢失
只读存储器（ROM）：ROM 一般只能用于数据的读取，不能写入数据，但是当机器停电时，这些数据不会丢失
高速缓存（Cache）：Cache 也是我们常见到的，它分为一级缓存（L1 Cache）、二级缓存（L2 Cache）、三级缓存（L3 Cache）这些数据，它位于内存和 CPU 之间，是一个读写速度比内存更快的存储器。当 CPU 向内存写入数据时，这些数据也会被写入高速缓存中。当 CPU 需要读取数据时，会直接从高速缓存中直接读取，当然，如需要的数据在 Cache 中没有，CPU 会再去读取内存中的数据。

内存管理机制

操作系统的内存管理主要负责内存的分配与回收（malloc 函数：申请内存，free 函数：释放内存），另外地址转换也就是将逻辑地址转换成相应的物理地址等功能也是操作系统内存管理做的事情。
连续分配管理方式：连续分配管理方式是指为一个用户程序分配一个连续的内存空间，常见的如块式管理
1. 块式管理：将内存分为几个固定大小的块，每个块中只包含一个进程。如果程序运行需要内存的话，操作系统就分给他一块，如果程序运行只需要很小的空间，分配的这块内存很大一部分几乎被浪费了。这些在每个块中未曾被利用的空间，我们称之为碎片
非连续分配管理方式：非连续分配管理方式允许一个程序使用的内存分布在离散或者说不相邻的内存中
1. 页式管理：把主存分为大小相等且固定的一页一页的形式，页较小，相对相比与块式管理的划分力度更大，提高了内存利用率，减少了碎片。页式管理通过页表对应逻辑地址和物理地址。
2. 段式管理：页式管理虽然提高了内存利用率，但是页式管理其中的页实际并无任何实际意义。段式管理把主存分为一段段的，每一段的空间又要比一页的空间小很多，但是，最重要的是段是有实际意义的，每个段定义了一组逻辑信息，例如，有主程序段MAIN、子程序段X、数据段D及栈段S等。段式管理通过段表对应逻辑地址和物理地址。
3. 段页式管理机制：段页式管理机制结合了段式管理和页式管理的优点。简单来说段页式管理机制就是把主存先分成若干段，每个段又分成若干页，也就是说段页式管理机制中段与段之间以及段的内部都是离散的。

分页和分段共同点和区别

共同点：
1. 分页机制和分段机制都是为了提高内存利用率，较少内存碎片
2. 页和段都是离散存储的，所以两者都是离散分配内存的方式，但是，每个页和段中的内存都是连续的。
分段和分页的不同：
1. 目的不同：分页是由于系统管理的需要而不是用户的需要，它是信息的物理单位；分段的目的是为了能更好地满足用户的需要，它是信息的逻辑单位，它含有一组其意义相对完整的信息；
2. 大小不同：页的大小固定且由系统决定；而段的长度却不固定，由其所完成的功能决定；
3. 地址空间不同：段向用户提供二维地址空间；页向用户提供的是一维地址空间；
4. 信息共享：段是信息的逻辑单位，便于存储保护和信息的共享，页的保护和共享受到限制。
5. 内存碎片：页式存储管理的优点是没有外碎片（因为页的大小固定），但会产生内碎片（一个页可能填充不满）；而段式管理的优点是没有内碎片（因为段大小可变，改变段大小来消除内碎片）。但段换入换出时，会产生外碎片（比如4k的段换5k的段，会产生1k的外碎片）。

基本分页存储管理方式

在分页内存管理中，很重要的两点是：
1. 虚拟地址到物理地址的转换要快【快表】；
2. 解决虚拟地址空间大，页表也会很大的问题【多级分页】
因为程序数据存储在不同的页面中，而页面又离散的分布在内存中，因此需要一个页表来记录逻辑地址和实际存储地址之间的映射关系，以实现从页号到物理块号的映射
由于页表也是存储在内存中的，因此访问分页系统中内存数据需要两次的内存访问【一次是从内存中访问页表，从中找到指定的物理块号，加上页内偏移得到实际物理地址；第二次就是根据第一次得到的物理地址访问内存取出数据】
为了减少两次访问内存导致的效率影响，分页管理中引入了快表机制，当要访问内存数据的时候，首先将页号在快表中查询，如果查找到说明要访问的页表项在快表中，那么直接从快表中读取相应的物理块号；如果没有找到，那么访问内存中的页表，从页表中得到物理地址，同时将页表中的该映射表项添加到快表中。
在某些计算机中如果内存的逻辑地址很大，将会导致程序的页表项会很多，而页表在内存中是连续存放的，所以相应的就需要较大的连续内存空间。为了解决这个问题，可以采用两级页表或者多级页表的方法。
其中外层页表一次性调入内存且连续存放，内层页表离散存放。相应的访问内存页表的时候需要一次地址变换，访问逻辑地址对应的物理地址的时候也需要一次地址变换，而且一共需要访问内存3次才可以读取一次数据。

基本分段存储管理方式

分页是为了提高内存利用率，而分段是为了满足程序员在编写代码的时候的一些逻辑需求【比如数据共享，数据保护，动态链接等】
分段内存管理当中，地址是二维的，一维是段号，一维是段内地址；其中每个段的长度是不一样的，而且每个段内部都是从 0 开始编址的。
由于分段管理中，每个段内部是连续内存分配，但是段和段之间是离散分配的，因此也存在一个逻辑地址到物理地址的映射关系，相应的就是段表机制。段表中的每一个表项记录了该段在内存中的起始地址和该段的长度。段表可以放在内存中也可以放在寄存器中。
访问内存的时候根据段号和段表项的长度计算当前访问段在段表中的位置，然后访问段表，得到该段的物理地址，根据该物理地址以及段内偏移量就可以得到需要访问的内存。由于也是两次内存访问，所以分段管理中同样引入了联想寄存器。

段页式内存管理

页式存储管理能有效地提高内存利用率，而分段存储管理能反映程序的逻辑结构并有利于段的共享。
段页式管理就是将程序分为多个逻辑段，在每个段里面又进行分页，即将分段和分页组合起来使用。
为了实现地址变换，系统为每个进程建立一张段表，而每个分段有一张页表（在一个进程中，段表只有一个，而页表可能有多个）
在进行地址变换时，首先通过段表查到页表起始地址，然后通过页表找到页帧号，最后形成物理地址。如下图所示，进行一次访问实际需要至少三次访问主存，这里同样可以使用快表以加快查找速度，其关键字由段号、页号组成，值是对应的页帧号和保护码。

三次内存访问：
1. 访问内存中的段表查到页表的起始地址
2. 访问内存中的页表找到页帧号，形成物理地址
3. 得到物理地址后，再一次访问内存，存取指令或者数据

Q：页式存储，段式存储，段页式存储，引入快表，访问内存次数

页式存储（2 次）

访问内存中的页表，利用逻辑地址中的页号查找到页帧号，与逻辑地址中的页内偏移拼接形成物理地址；
得到物理地址后，再一次访问内存，存取指令或者数据。

段式存储（2 次）

同页式存储

段页式存储（3 次）

访问内存中的段表查到页表的起始地址
访问内存中的页表找到页帧号，形成物理地址
得到物理地址后，再一次访问内存，存取指令或者数据

多级页表

若页表划分为 N 级，则需要访问内存 N+1 次。
若系统有快表，则在快表命中时，只需访问 1 次内存即可

引入快表

因为把页表放在内存中，至少需要访问两次内存才能存取一条指令或者数据（一次得到物理地址地址，一次存取），比较慢；因此在地址变换机构中增设了一个具有并行查找能力的高速缓冲寄存器—— 快表（全局只有一个，不在内存中！！！），用来存放当前访问的若干页表项（比较小，只能存放部分页表项）
若快表命中，则可直接得到页帧号，与页内偏移拼接成物理地址后访问内存，进行指令或者数据的存取。（只需访问一次内存）
若快表不命中，则需去内存中访问页表，形成物理地址后，再一次访问内存进行指令或者数据的存取。（需要访问两次内存）

物理内存 & 虚拟内存

正在运行的一个进程，他所需的内存是有可能大于内存条容量之和的，比如你的内存条是 256M，你的程序却要创建一个 2G 的数据区，那么不是所有数据都能一起加载到内存（物理内存）中，势必有一部分数据要放到其他介质中（比如硬盘），待进程需要访问那部分数据时，在通过调度进入物理内存。所以，虚拟内存是进程运行时所有内存空间的总和，并且可能有一部分不在物理内存中，而物理内存就是我们平时所了解的内存条。有的地方呢，也叫这个虚拟内存为内存交换区。
虚拟内存的作用就是，将需要大内存的分块，一块一块的递给物理内存。换言之，虚拟内存是通过页面调度实现的。
虚拟内存的目的是为了让物理内存扩充成更大的逻辑内存，从而让程序获得更多的可用内存。
1. 为了更好的管理内存，操作系统将内存抽象成地址空间。每个程序拥有自己的地址空间，这个地址空间被分割成多个块，每一块称为一页。
2. 这些页被映射到物理内存，但不需要映射到连续的物理内存，也不需要所有页都必须在物理内存中。
3. 当程序引用到不在物理内存中的页时，由硬件执行必要的映射，将缺失的部分装入物理内存并重新执行失败的指令。

进程的内存分配 & 内存访问

进程是在虚拟内存中的，每个进程运行时都会得到 4G 的虚拟内存，得到的这 4G 虚拟内存是一个连续的地址空间（这也只是进程认为），而实际上，它通常是被分隔成多个物理内存碎片，还有一部分存储在外部磁盘存储器上，在需要时进行数据交换。
进程内存访问
1. 每次要访问地址空间上的某一个地址，都需要把虚拟地址翻译为实际物理内存地址
2. 所有进程共享这整一块物理内存，每个进程只把自己目前需要的虚拟地址空间映射到物理内存上
3. 进程需要知道哪些地址空间上的数据在物理内存上，哪些不在（可能这部分存储在磁盘上），还有在物理内存上的哪里，这就需要通过页表来记录
4. 页表的每一个表项分两部分，第一部分记录此页是否在物理内存上（页面号），第二部分记录物理内存页的地址（偏移量）
5. 当进程访问某个虚拟地址的时候，就会先去看页表，如果发现对应的数据不在物理内存上，就会发生缺页异常
6. 缺页异常的处理过程，操作系统立即阻塞该进程，并将硬盘里对应的页换入内存，然后使该进程就绪，如果内存已经满了，没有空地方了，那就找一个页覆盖，至于具体覆盖的哪个页，就需要看操作系统选择的页面置换算法

虚拟内存置换算法

最佳(Optimal)置换算法：

一种理论算法，无法实现，置换策略是将当前页面中在未来最长时间内不会被访问的页置换出去。

先进先出(FIFO)页面置换算法：

每次淘汰最早调入的页面。

最近最久未使用算法 LRU：

算法赋予每个页面一个访问字段，用来记录一个页面自上次被访问以来所经历的时间 t，当须淘汰一个页面时，选择现有页面中其 t 值最大的，即最近最久未使用的页面予以淘汰。

时钟算法 clock(也被称为是最近未使用算法 NRU)：

页面设置一个访问位，并将页面链接为一个环形队列，页面被访问的时候访问位设置为 1。页面置换的时候，如果当前指针所指页面访问为为 0，那么置换，否则将其置为 0，循环直到遇到一个访问为位 0 的页面。

改进型 Clock 算法：

在 Clock 算法的基础上添加一个修改位，替换时根据访问位和修改位综合判断。优先替换访问位和修改位都是 0 的页面，其次是访问位为 0 修改位为 1 的页面。

最少使用算法 LFU：

设置寄存器记录页面被访问次数，每次置换的时候置换当前访问次数最少的。

Q Debug时看到的时物理内存还是虚拟内存？

Ans 虚拟内存，通常，在用户模式下，我们用调试器看到的内存地址都是虚拟内存。

操作系统是如何实现锁的？

首先要搞清楚一个概念，在硬件层面，CPU 提供了原子操作、关中断、锁内存总线的机制；OS 基于这几个 CPU 硬件机制，就能够实现锁；再基于锁，就能够实现各种各样的同步机制（信号量、消息、Barrier 等）在多线程编程中，为了保证数据操作的一致性，操作系统引入了锁机制，用于保证临界区代码的安全。通过锁机制，能够保证在多核多线程环境中，在某一个时间点上，只能有一个线程进入临界区代码，从而保证临界区中操作数据的一致性。 锁机制的一个特点是它的同步原语都是原子操作 Q 那么操作系统是如何保证这些同步原语的原子性呢？ Ans 操作系统之所以能构建锁之类的同步原语，是因为硬件已经为我们提供了一些原子操作，例如：

中断禁止和启用（interrupt enable/disable）
内存加载和存入（load/store）测试与设置（test and set）指令

禁止中断这个操作是一个硬件步骤，中间无法插入别的操作。同样，中断启用，测试与设置均为一个硬件步骤的指令。在这些硬件原子操作之上，我们便可以构建软件原子操作：锁，睡觉与叫醒，信号量等。

操作系统使用锁的原语操作

可以使用中断禁止，测试与设置两种硬件原语来实现软件的锁原语。这两种方式比较起来，显然测试与设置更加简单，也因此使用的更为普遍。此外，test and set还有一个优点，就是可以在多 CPU 环境下工作，而中断启用和禁止则不能。 使用中断启用与禁止来实现锁： 要防止一段代码在执行过程中被别的进程插入，就要考虑在一个单处理器上，一个线程在执行途中被切换的途径。我们知道，要切换进程，必须要发生上下文切换，上下文切换只有两种可能：

一个线程自愿放弃 CPU 而将控制权交给操作系统调度器（通过 yield 之类的操作系统调用来实现）；
一个线程被强制放弃 CPU 而失去控制权（通过中断来实现）

原语执行过程中，我们不会自动放弃 CPU 控制权，因此要防止进程切换，就要在原语执行过程中不能发生中断。所以采用禁止中断，且不自动调用让出 CPU 的系统调用，就可以防止进程切换，将一组操作变为原子操作。

中断禁止：就是禁止打断，使用可以将一系列操作变为原子操作
中断启用：就是从这里开始，可以被打断，允许操作系统进行调度

缺点：使用中断实现锁，繁忙等待，不可重入使用测试与设置指令来实现锁测试与设置（test & set）指令：以不可分割的方式执行如下两个步骤：

设置操作：将 1 写入指定内存单元；
读取操作：返回指定内存单元里原来的值（写入 1 之前的值）

缺点：繁忙等待，不可重入

操作系统中的锁机制

互斥锁：mutex，用于保证在任何时刻，都只能有一个线程访问该对象。只有取得互斥锁的进程才能进入临界区，无论读写，当获取锁操作失败时，线程会进入睡眠，等待锁释放时被唤醒。
读写锁：rwlock，分为读锁和写锁。读写锁要根据进程进入临界区的具体行为（读，写）来决定锁的占用情况。这样锁的状态就有三种了：读加锁、写加锁、无锁。 1. 无锁。读/写进程都可以进入； 2. 读锁。读进程可以进入。写进程不可以进入； 3. 写锁。读/写进程都不可以进入
自旋锁：spinlock，自旋锁是指在进程试图取得锁失败的时候选择忙等待而不是阻塞自己。选择忙等待的优点在于如果该进程在其自身的 CPU 时间片内拿到锁（说明锁占用时间都比较短），则相比阻塞少了上下文切换注意这里还有一个隐藏条件：多处理器。因为单个处理器的情况下，由于当前自旋进程占用着 CPU，持有锁的进程只有等待自旋进程耗尽 CPU 时间才有机会执行，这样 CPU 就空转了
RCU：read-copy-update，在修改数据时，首先需要读取数据，然后生成一个副本，对副本进行修改，修改完成后，再将老数据 update 成新的数据。【有点像copy-on-write】
- 使用 RCU 时，读者几乎不需要同步开销，既不需要获得锁，也不使用原子指令，不会导致锁竞争，因此就不用考虑死锁问题了。
- 对于写者的同步开销较大，它需要复制被修改的数据，还必须使用锁机制同步并行其它写者的修改操作。
- 在有大量读操作，少量写操作的情况下效率非常高。【读多写少】

死锁

死锁是指多个进程在运行过程中因争夺资源而造成的一种僵局，当进程处于这种僵持状态时，若无外力作用，它们都将无法再向前推进

产生死锁的根本原因

多个进程竞争资源
进程间推进顺序不当

产生死锁的必要条件

互斥条件，在任何时刻一个资源只能被一个进程使用
拥有和请求（请求和保持条件），已经得到某个资源的进程可以再请求新的资源
不可抢占（不剥夺条件），已经分配给进程的资源不能被抢占，而只能被显式释放
循环等待（环路等待条件），系统中有两个或多个的进程组成一条循环，该循环中的每个进程都等待着另一个进程占有的资源

处理策略

解决死锁：【撤销进程法】
死锁预防：破坏死锁产生的四个必要条件中的一个或多个，以避免发生死锁。【资源有序分配法】
1. 破坏互斥：不让资源被一个进程独占，可通过假脱机技术允许多个进程同时访问资源；
2. 破坏拥有和请求：1. 已拥有资源的进程不能再去请求其他资源，要求进程在开始执行前请求需要的所有资源；2. 要求进程请求资源时，先暂时释放其当前拥有的所有资源，再尝试一次获取所需的全部资源
3. 破坏不可抢占：有些资源可以通过虚拟化方式实现可抢占
4. 破坏循环等待：1. 保证每个进程在任何时刻只能占用一个资源，如果要请求另一个资源，必须先释放第一个资源；是将所有资源进行统一编号，进程可以在任何时刻请求资源，但要求进程必须按照顺序请求资源
避免死锁：判断是否会出现死锁就是看是否能找到一个安全序列，使得进程按推进顺序为每个进程分配其所需资源，使每个进程都能顺序执行。例如：【银行家算法】
检测死锁并恢复：资源分配图；从一个或多个进程中抢占资源分配给死锁进程；终止所有的死锁进程。【资源分配图化简法】

Q 如何发现死锁？

通过死锁检测工具，例如通过 jdk 工具 jps、jstack 排查死锁问题

使用 jsp 查找程序进行：jps 是 jdk 提供的一个工具，可以查看到正在运行的 java 进程
使用 jstack 查看线程堆栈信息：jstack：jdk 提供的一个工具，可以查看 java 进程中线程堆栈信息，后面可以查看到具体在代码哪一行。
也通过 jdk 提供的工具 jconsole 排查死锁问题：jconsole 是 JDK 提供的一个可视化的工具，方便排查程序的一些问题，如：程序内存溢出、死锁问题等等。

中断 Interrupt

早期计算机各个程序只能串行执行、系统资源利用低。为了解决上述问题，操作系统引入了中断机制，实现了多道程序的并发执行，提高了系统资源的利用率。 中断是多程序并发执行的前提条件

当一个时间片运行完后，CPU 会接收到计时部件（操作系统内核的时钟管理部件）发出的中断信号，CPU 立即进入核心态，把 CPU 的使用权限交还给操作系统
当中断发生后，当前运行的进程暂停运行，操作系统内核对中断进程处理，切换进程（根据进程调度算法），在完成切换进程的一系列工作后，操作系统又会将 CPU的使用权交还给用户进程
切换到的进程 2 拿到 CPU 执行权就会在用户态下执行

中断的本质：发生中断就意味着需要操作系统介入，开展管理工作

中断的处理过程

执行完每个指令后，CPU 都要检查当前是否有外部中断信号
如果检测到外部中断信号，则需要保护被中断进程的 CPU 环境（如程序状态字PSW、程序计数器、各种通用寄存器）
根据中断信号类型转入相应的中断处理程序
恢复进程的 CPU 环境并退出中断，返回原进程继续往下执行

中断的分类

中断可以分为：内中断和外中断

内中断：内中断的信号来源于 CPU 内部、与当前执行的指令有关。如整数除 0
外中断：外中断的信号来源于 CPU 外部、与当前执行的指令无关。如用户强制结束一个进程、IO 设备完成操作发生的中断信号

缺页中断

在请求分页系统中，可以通过查询页表中的状态位来确定所要访问的页面是否存在于内存中。每当所要访问的页面不在内存是，会产生一次缺页中断，此时操作系统会根据页表中的外存地址在外存中找到所缺的一页，将其调入内存。缺页本身是一种中断，与一般的中断一样，需要经过 4 个处理步骤：

保护 CPU 现场
分析中断原因
转入缺页中断处理程序进行处理
恢复 CPU 现场，继续执行

但是缺页中断是由于所要访问的页面不存在于内存时，由硬件所产生的一种特殊的中断，因此，与一般的中断存在区别：

在指令执行期间产生和处理缺页中断信号
一条指令在执行期间，可能产生多次缺页中断
缺页中断返回的是，执行产生中断的一条指令，而一般的中断返回的是，执行下一条指令

线程 & 进程

线程 Thread

Q 操作系统临界资源的访问

临界资源：一段时间内只允许一个线程访问的资源就称为临界资源或独占资源
临界区：对临界资源进行访问的那段代码称为临界区，通过对多线程的串行化来访问公共资源或一段代码，速度快，适合控制数据访问

多线程同步互斥的常见方法

互斥量(Mutex)：采用互斥对象机制，只有拥有互斥对象的线程才有访问公共资源的权限。因为互斥对象只有一个，所以可以保证公共资源不会被多个线程同时访问。比如 Java 中的 synchronized 关键词和各种 Lock 都是这种机制，本质是一个计数器
信号量 PV(Semphares)：它允许同一时刻多个线程来访问同一资源，但是需要控制同一时刻访问此资源的最大线程数量【用来实现生产者消费者模型】信号量的数据结构为一个值和一个指针，指针指向等待该信号量的下一个进程，信号量的值与相应资源的使用情况有关。当它的值大于 0 时，表示当前可用资源的数量；当它的值小于 0 时，其绝对值表示等待使用该资源的进程个数。
- 注意，信号量的值仅能由 PV 操作来改变
- p 操作（wait）：申请一个单位资源，进程进入；v 操作（signal）：释放一个单位资源，进程出来
- PV 操作的含义：PV 操作由 P 操作原语和 V 操作原语组成（原语是不可中断的过程），对信号量进行操作
事件 event：通过通知操作的方式来保持多线程同步，还可以方便实现多线程优先级的比较操作，Wait/Notify

线程通信

synchronized 同步：本质上就是 “共享内存” 式的通信。多个线程需要访问同一个共享变量，谁拿到了锁（获得了访问权限），谁就可以执行。
while 轮询的方式：
在这种方式下，ThreadA 不断地改变条件，ThreadB 不停地通过 while 语句检测这个条件比如说互斥量为 0 是否成立，从而实现了线程间的通信。但是这种方式会浪费 CPU 资源。
wait/notify 机制：
- 当条件未满足时，ThreadA 调用 wait() 放弃 CPU，并进入阻塞状态。（不像 while 轮询那样占用 CPU）
- 当条件满足时，ThreadB 调用 notify() 通知线程 A，所谓通知线程 A，就是唤醒线程 A，并让它进入可运行状态
管道通信：java.io.PipedInputStream 和 java.io.PipedOutputStream 进行通信

进程 Process

进程控制块 (Process Control Block，PCB) 描述进程的基本信息和运行状态，所谓的创建进程和撤销进程，都是指对 PCB 的操

进程状态

创建状态(new) ：进程正在被创建，尚未到就绪状态
就绪状态(ready)：进程已处于准备运行状态，即进程获得了除了处理器之外的一切所需资源，一旦得到处理器资源(处理器分配的时间片)即可运行
运行状态(running) ：进程正在处理器上上运行（单核 CPU 下任意时刻只有一个进程处于运行状态）
阻塞状态(waiting) ：又称为等待状态，进程正在等待某一事件而暂停运行如等待某资源为可用或等待 IO 操作完成。即使处理器空闲，该进程也不能运行
结束状态(terminated) ：进程正在从系统中消失。可能是进程正常结束或其他原因中断退出运行
- 只有就绪态和运行态可以相互转换，其它的都是单向转换。就绪状态的进程通过调度算法从而获得 CPU 时间，转为运行状态；而运行状态的进程，在分配给它的CPU 时间片用完之后就会转为就绪状态，等待下一次调度。
- 阻塞状态是缺少需要的资源从而由运行状态转换而来，但是该资源不包括 CPU 时间，缺少 CPU 时间会从运行态转换为就绪态
挂起（换到外存）:
挂起就绪：是指进程被对换到辅存时的就绪状态，是不能被直接调度的状态，只有当主存中没有活跃就绪态进程，或者是挂起就绪态进程具有更高的优先级，系统将把挂起就绪态进程调回主存并转换为活跃就绪。

进程同步

临界区：对临界资源进行访问的那段代码称为临界区。
同步与互斥：同步：多个进程因为合作产生的直接制约关系，使得进程有一定的先后执行关系。互斥：多个进程在同一时刻只有一个进程能进入临界区。
信号量：信号量（Semaphore）是一个整型变量，可以对其执行 down 和 up 操作，也就是常见的 P 和 V 操作。
1. down : 如果信号量大于 0 ，执行 -1 操作；如果信号量等于 0，进程睡眠，等待信号量大于 0；
2. up ：对信号量执行 +1 操作，唤醒睡眠的进程让其完成 down 操作
3. down 和 up 操作需要被设计成原语，不可分割，通常的做法是在执行这些操作的时候屏蔽中断
4. 如果信号量的取值只能为 0 或者 1，那么就成为了互斥量（Mutex），0 表示临界区已经加锁，1 表示临界区解锁。
管程：管程在功能上和信号量及 PV 操作类似，属于一种进程同步互斥工具，但是具有与信号量及 PV 操作不同的属性。管程把控制的代码独立出来，封装了同步操作，对进程隐蔽了同步细节，简化了同步功能的调用界面。用户编写并发程序如同编写顺序(串行)程序。
1. 管程有一个重要特性：在一个时刻只能有一个进程使用管程。进程在无法继续执行的时候不能一直占用管程，否则其它进程永远不能使用管程。
2. 管程引入了条件变量以及相关的操作：wait() 和 signal() 来实现同步操作。对条件变量执行 wait() 操作会导致调用进程阻塞，把管程让出来给另一个进程持有。signal() 操作用于唤醒被阻塞的进程。

进程同步和进程通信的区别
进程同步：控制多个进程按一定顺序执行
进程通信：进程间传输信息

进程通信是一种手段，而进程同步是一种目的。也可以说，为了能够达到进程同步的目的，需要让进程进行通信，传输一些进程同步所需要的信息

Q 常见的进程间的通信方式（IPC，Inter-Process Communication）？

管道：管道可用于具有亲缘关系的父子进程间的通信。linux 系统操作执行命令时，将一个程序的输出交给另一个程序进行处理。一个进程往管道输入数据，则会阻塞等待别的进程从管道读取数据。管道是通过调用 pipe 函数创建的，fd[0] 用于读，fd[1] 用于写。它具有以下限制：
1. 只支持半双工通信（单向交替传输）；
2. 只能在父子进程或者兄弟进程中使用
命名管道（FIFO）：克服了管道没有名字的限制，具有管道所具有的功能外，还允许无亲缘关系进程间的通信，去除了管道只能在父子进程中使用的限制
信号（singal）：信号是在软件层次上对中断机制的一种模拟，一种比较复杂的通信方式，用于通知接收进程某个事件已经发生。一个进程收到一个信号与处理器收到一个中断请求效果上可以说是一致的。大多数来源于键盘输入、硬件故障、系统调用、应用程序自身的非法运算。一旦信号产生了，进程就会有三种选择：忽略、捕捉、执行默认操作。其实大多数应用开发者都采用忽略信号或者执行信号默认动作，这是一种“信号来了，我不管”的姿态。
消息队列：消息队列提供了从一个进程向另一个进程发送一个数据块的方法。
1. 相比于命名管道的优点：消息队列可以独立于读写进程存在，从而避免了FIFO 中同步管道的打开和关闭时可能产生的困难；避免了 FIFO 的同步阻塞问题，不需要进程自己提供同步方法；读进程可以根据消息类型有选择地接收消息，而不像 FIFO 那样只能默认地接收。
2. 缺点：使用消息队列进行进程间通信，可能会收到数据块最大长度的限制约束等。如果频繁的发生进程间的通信行为，那么进程需要频繁地读取队列中的数据到内存，相当于间接地从一个进程拷贝到另一个进程，这需要花费时间
共享内存：共享内存可以很好解决拷贝消耗的时间。共享内存其实是 把同一块物理内存映射到不同进程的虚拟地址空间当中，不同的进程直接通过修改各自虚拟地址空间当中的内容，就可以完成通信。共享内存几乎不需要进行内存数据拷贝就能实现，即数据从进程A的虚拟内存空间中写入数据，立即就能被进程B感知。其它的进程间通信机制，需要经过 Linux 内核这种中转站进行多次的数据拷贝操作才可以。因此，使用共享内存通信比较高效。
1. 允许多个进程共享一个给定的存储区，不同进程可以及时看到对方进程中对共享内存中数据变更。因为数据不需要在进程之间复制，所以这是最快的一种 IPC
2. 共享内存需要依靠某种同步操作，如互斥锁和信号量等，需要使用信号量用来同步对共享存储的访问。
3. 系统加载一个进程的时候，分配给进程的内存并不是实际物理内存，而是虚拟内存空间。可以让两个进程各自拿出一块虚拟地址空间，然后映射到相同的物理内存中，这样，两个进程虽然有着独立的虚拟内存空间，但有一部分却是映射到相同的物理内存，这就完成了内存共享机制了。
4. Linux内核提供了两种共享内存的实现，一种是基于物理内存映射，另一种是基于mmap文件映射。
信号量（mutex）：为了避免共享内存多进程竞争内存的问题（线程安全），使用信号量。
1. 信号量的本质就是一个计数器，用来实现进程之间的互斥与同步，用于为多个进程提供对共享数据对象的访问，信号量也是进程之间的一种通信方式。
Socket：Socket 套接字进行通信，与其他机制不同的是，它可用于不同机器之间的进程间通信，应用非常广泛。

常见的31种信号

[] TODO

  
 # kill -l
 1) SIGHUP       2) SIGINT       3) SIGQUIT      4) SIGILL       5) SIGTRAP
 6) SIGABRT      7) SIGBUS       8) SIGFPE       9) SIGKILL     10) SIGUSR1
11) SIGSEGV     12) SIGUSR2     13) SIGPIPE     14) SIGALRM     15) SIGTERM
16) SIGSTKFLT   17) SIGCHLD     18) SIGCONT     19) SIGSTOP     20) SIGTSTP
21) SIGTTIN     22) SIGTTOU     23) SIGURG      24) SIGXCPU     25) SIGXFSZ
26) SIGVTALRM   27) SIGPROF     28) SIGWINCH    29) SIGIO       30) SIGPWR
31) SIGSYS      34) SIGRTMIN    35) SIGRTMIN+1  36) SIGRTMIN+2  37) SIGRTMIN+3
38) SIGRTMIN+4  39) SIGRTMIN+5  40) SIGRTMIN+6  41) SIGRTMIN+7  42) SIGRTMIN+8
43) SIGRTMIN+9  44) SIGRTMIN+10 45) SIGRTMIN+11 46) SIGRTMIN+12 47) SIGRTMIN+13
48) SIGRTMIN+14 49) SIGRTMIN+15 50) SIGRTMAX-14 51) SIGRTMAX-13 52) SIGRTMAX-12
53) SIGRTMAX-11 54) SIGRTMAX-10 55) SIGRTMAX-9  56) SIGRTMAX-8  57) SIGRTMAX-7
58) SIGRTMAX-6  59) SIGRTMAX-5  60) SIGRTMAX-4  61) SIGRTMAX-3  62) SIGRTMAX-2
63) SIGRTMAX-1  64) SIGRTMAX

进程的调度

批处理系统

批处理系统没有太多的用户操作，在该系统中，调度算法目标是保证吞吐量和周转时间（从提交到终止的时间）

先来先服务调度算法（FCFS）
1. 每次调度是从就绪队列中选择一个最先进入该队列的进程，为之分配处理机，使之投入运行。该进程一直运行到完成或发生某事件而阻塞后才放弃处理机。
2. 比较有利于长作业（进程），而不利于短作业（进程）
3. 有利于 CPU 繁忙型作业（进程），而不利于 I/O 繁忙型作业（进程）
4. 用于批处理系统，不适于分时系统
短进程优先调度算法
1. 从就绪队列中选出一个估计运行时间最短的进程，将处理机分配给它，使它立即执行并一直执行到完成，或发生某事件而被阻塞放弃处理机时再重新调度。
2. 对长作业不利，未考虑作业(进程)的紧迫程度，因而不能保证紧迫性作业(进程)会被及时处理
最短剩余时间优先 shortest remaining time next（SRTN）
1. 最短作业优先的抢占式版本，按剩余运行时间的顺序进行调度。当一个新的作业到达时，其整个运行时间与当前进程的剩余时间作比较。如果新的进程需要的时间更少，则挂起当前进程，运行新的进程。否则新的进程等待。

交互式系统

交互式系统有大量的用户交互操作，在该系统中调度算法的目标是快速地进行响应

时间片轮转法
- 系统将所有的就绪进程按先来先服务的原则排成一个队列，每次调度时，把CPU 分配给队首进程，并令其执行一个时间片。当执行的时间片用完时，由一个计时器发出时钟中断请求，调度程序便据此信号来停止该进程的执行，并将它送往就绪队列的末尾；然后，再把处理机分配给就绪队列中新的队首进程，同时也让它执行一个时间片。
- 紧迫任务响应慢。
多级反馈队列调度算法
- 设置多个就绪队列，并为各个队列赋予不同的优先级；该算法赋予各个队列中进程执行时间片的大小也各不相同，在优先权愈高的队列中，为每个进程所规定的执行时间片就愈小。
- 当一个新进程进入内存后，首先将它放入第一队列的末尾，按 FCFS 原则排队等待调度；当轮到该进程执行时，如它能在该时间片内完成，便可准备撤离系统；如果它在一个时间片结束时尚未完成，调度程序便将该进程转入第二队列的末尾，再同样地按 FCFS 原则等待调度执行；
- 仅当第一队列空闲时，调度程序才调度第二队列中的进程运行
优先权调度算法：把处理机分配给就绪队列中优先权最高的进程
- 非抢占式优先权算法：系统一旦把处理机分配给就绪队列中优先权最高的进程后，该进程便一直执行下去，直至完成；
- 抢占式优先权调度算法：系统把处理机分配给优先权最高的进程，使之执行。但在其执行期间，只要出现了另一个其优先权更高的进程，进程调度程序就立即停止当前进程（原优先权最高的进程）的执行，重新将处理机分配给新到的优先权最高的进程。
- 这种抢占式的优先权调度算法能更好地满足紧迫作业的要求，故而常用于要求比较严格的实时系统中，以及对性能要求较高的批处理和分时系统中

实时系统

实时系统要求一个请求在一个确定时间内得到响应。分为硬实时和软实时，前者必须满足绝对的截止时间，后者可以容忍一定的超时。

Quiz 如何用最短的时间执行完？

有 5 个任务，每个任务权重 15524，执行时间 15534，如何用最短的时间执行完？ WARNING：这是我面试中遇到的问题，以下为我个人思考的答案，仅供参考

可以采用多级反馈队列调度算法，可以看成时间片轮转调度和优先级调度的结合
最上面的队列，优先级最高，首先调度优先级高的队列中的进程。若高优先级中队列中已没有调度的进程，则调度次优先级队列中的进程
如果它在一个时间片结束时尚未完成，调度程序便将该进程转入第二队列的末尾，若第二队列的时间片用完后作业还不能完成，一直进入下一级队列，直至完成
在低优先级的队列中的进程在运行时，又有新到达的作业，那么在运行完这个时间片后，CPU 马上分配给新到达的作业即抢占式调度 CPU

进程和线程的区别

拥有资源：进程是资源分配的基本单位，但是线程不拥有资源，线程可以访问隶属进程的资源
调度：线程是独立调度的基本单位，在同一进程中，线程的切换不会引起进程切换，从一个进程中的线程切换到另一个进程中的线程时，会引起进程切换【一个进程有多个线程】
系统开销：由于创建或撤销进程时，系统都要为之分配或回收资源，如内存空间，I/O 设备等，所付出的开销远大于创建或撤销线程时的开销；类似地，在进行进程切换时，涉及当前执行进程 CPU 环境的保存及新调度进程 CPU 环境的设置，而线程切换时只需保存和设置少量寄存器内容，开销很小。
通信：线程间可以通过直接读写同一进程中的数据进行通信【线程共享进程内存空间】，但是进程通信需要借助 IPC

多进程 & 多线程

进程

优点：

顺序程序的特点：具有封闭性和可再现性；
程序的并发执行和资源共享。多道程序设计出现后，实现了程序的并发执行和资源共享，提高了系统的效率和系统的资源利用率。

缺点：

操作系统调度切换多个线程要比切换调度进程在速度上快的多。而且进程间内存无法共享，通讯也比较麻烦；
线程之间由于共享进程内存空间，所以交换数据非常方便；在创建或撤消进程时，由于系统都要为之分配和回收资源，导致系统的开销明显大于创建或撤消线程时的开销。

线程

优点：

启动一个线程所花费的空间远远小于启动一个进程所花费的空间，而且，线程间彼此切换所需的时间也远远小于进程间切换所需要的时间（因为在Linux 系统下，启动一个新的进程必须分配给它独立的地址空间，建立众多的数据表来维护它的代码段、堆栈段和数据段。线程之间却可以使用相同的地址空间，共享大部分数据）；
线程间方便的通信机制，由于同一进程下的线程之间共享数据空间，所以一个线程的数据可以直接为其它线程所用，这不仅快捷，而且方便；
使多 CPU 系统更加有效。操作系统会保证当线程数不大于 CPU 数目时，不同的线程运行于不同的 CPU 上；

缺点：

调度时, 要保存线程状态，频繁调度, 需要占用大量的机时；程序设计上容易出错（线程同步问题）

多进程

多进程优点：

每个进程互相独立，不影响主程序的稳定性，子进程崩溃没关系；
通过增加 CPU，就可以容易扩充性能；
可以尽量减少线程加锁/解锁的影响，极大提高性能，就算是线程运行的模块算法效率低也没关系；
每个子进程都有 2GB 地址空间和相关资源，总体能够达到的性能上限非常大。

多进程缺点：

逻辑控制复杂，需要和主程序交互；
需要跨进程边界，如果有大数据量传送，就不太好，适合小数据量传送、密集运算；
多进程调度开销比较大。

多线程

多线程的优点：

无需跨进程边界；
程序逻辑和控制方式简单；
所有线程可以直接共享内存和变量等；
线程方式消耗的总资源比进程方式好；

多线程缺点：

每个线程与主程序共用地址空间，受限于 2GB 地址空间；
线程之间的同步和加锁控制比较麻烦；
一个线程的崩溃可能影响到整个程序的稳定性；
到达一定的线程数程度后，即使再增加 CPU 也无法提高性能，例如 Windows Server 2003，大约是 1500 个左右的线程数就快到极限了（线程堆栈设定为 1M），如果设定线程堆栈为 2M，还达不到 1500 个线程总数；
线程能够提高的总性能有限，而且线程多了之后，线程本身的调度也是一个麻烦事儿，需要消耗较多的 CPU

孤儿进程 & 僵尸进程

一般进程，正常情况下：子进程由父进程创建，子进程再创建新的进程。父子进程是一个异步过程，父进程永远无法预测子进程的结束，所以，当子进程结束后，它的父进程会调用 wait()或 waitpid()取得子进程的终止状态，回收掉子进程的资源。

怎么产生的？

孤儿进程：父进程结束了，而它的一个或多个子进程还在运行，那么这些子进程就成为孤儿进程(father died)。子进程的资源由 init 进程回收
僵尸进程：子进程退出了，但是父进程没有用 wait 或 waitpid 去获取子进程的状态信息，子进程的进程描述符仍然保存在系统中

有什么危害？

如果父进程不调用 wait 或 waitpid 的话，那么保留的信息就不会被释放，其进程号就会被一直占用，但是系统所能使用的进程号是有限的，如果大量产生僵死进程，将因没有可用的进程号而导致系统无法产生新的进程，这就是僵尸进程的危害孤儿进程是没有父进程的进程，它由 init 进程循环的 wait()回收资源，init 进程充当父进程。因此孤儿进程并没有什么危害

怎么去预防？

fork()两次，将子进程变成孤儿进程，从而其父进程变成 init 进程，通过 init 进程处理僵尸进程【fork 函数的作用是从已经存在的进程中创建一个子进程，而原进程称为父进程】通过信号机制，在处理函数中调用 wait，回收资源

同步 & 异步

同步需要等待（阻塞），异步无需等待（不阻塞）

同步

可以理解为在执行完一个函数或方法之后，一直等待系统返回值或消息，这时程序是出于阻塞的，只有接收到返回的值或消息后才往下执行其他的命令同步就是整个处理过程顺序执行，当各个过程都执行完毕，并返回结果。是一种线性执行的方式，执行的流程不能跨越。一般用于流程性比较强的程序，比如用户登录，需要对用户验证完成后才能登录系统。

异步

执行完函数或方法后，不必阻塞性地等待返回值或消息，只需要向系统委托一个异步过程，那么当系统接收到返回值或消息时，系统会自动触发委托的异步过程，从而完成一个完整的流程异步则是只是发送了调用的指令，调用者无需等待被调用的方法完全执行完毕，而是继续执行下面的流程。是一种并行处理的方式，不必等待一个程序执行完，可以执行其它的任务，比如页面数据加载过程，不需要等所有数据获取后再显示页。

协程

进程/线程/协程区别

进程拥有自己独立的堆和栈，既不共享堆，亦不共享栈，进程由操作系统调度
线程拥有自己独立的栈和共享的堆，共享堆，不共享栈，线程亦由操作系统调度
协程和线程一样共享堆，不共享栈，协程由程序员在协程的代码里显示调度

协程与线程区别

一个线程可以多个协程，一个进程也可以单独拥有多个协程，这样 Python 中则能使用多核 CPU
线程进程都是同步机制，而协程则是异步
协程能保留上一次调用时的状态，每次过程重入时，就相当于进入上一次调用的状态
协程避免了无意义的调度，由此可以提高性能，但也因此，程序员必须自己承担调度的责任，同时，协程也失去了标准线程使用多 CPU 的能力

Q 协程是如何更少占用资源的？

协程切换完全在用户空间进行，线程切换涉及用户态和内核态切换，需要在内核空间完成
- 协程不依赖操作系统和其提供的线程
- 协程之间的切换完全在用户态执行，在用户态没有时钟中断，系统调用等机制，因此效率高。协程切换只涉及基本的 CPU 上下文切换（寄存器保存 CPU 运行任务所需要的信息），协程切换非常简单，就是把当前协程的 CPU 寄存器状态保存起来，然后将需要切换进来的协程的 CPU 寄存器状态加载的CPU 寄存器上。
- 系统内核调度的对象是线程，线程的调度只有拥有最高权限的内核空间才可以完成，所以线程的切换涉及到用户空间和内核空间的切换，现代操作系统一般都采用抢占式调度，上下文切换一般发生在时钟中断和系统调用返回前，调度器计算当前线程的时间片，如果需要切换就从运行队列中选出一个目标线程，保存当前线程的环境，并且恢复目标线程的运行环境。
协程占用内存少
- 线程除了和协程相同基本的 CPU 上下文，还有线程私有的栈和寄存器等，上下文比协程多一些

操作系统中的堆栈

操作系统的堆和栈是指对内存进行操作和管理的一些方式这和数据结构中的堆和栈是有区别的

栈

栈作为一种数据结构，相当于 只能在一端进行插入和删除操作的特殊线性表。它按照 后进先出 的原则存储数据，先进入的数据被压入栈底，最后进入的数据在栈顶，需要读数据的时候从栈顶开始弹出数据，最后进入的数据会被首先读出来。

栈也可以称之为栈内存是一个具有动态内存区域，存储函数内部（包括 main 函数）的局部变量，方法调用及函数参数值
由编译器/系统自动分配和释放。例如，声明在函数中一个局部变量，即 int b，系统自动在栈中为变量 b 开辟空间
栈存放函数的参数值，局部变量的值等。其操作方式类似于数据结构中的栈，满足：“先进后出”的原则存取，也就是位于栈内的元素，必须等到其上面（对应的地址为较低的地址）的数据或函数执行完成后，弹出后才可以进行下面的元素的操作
栈是由系统自动分配的，一般速度较快（栈的速度高于堆的速度）
申请大小的限制：栈是向低地址扩展的，是一块连续的内存的区域。栈顶的地址和栈的最大容量是系统预先规定好的，栈的大小是 2M（也有的说是 1M，总之是一个编译时就确定的常数 ) ，如果申请的空间超过栈的剩余空间时，将提示 Stack Overflow。因此，能从栈获得的空间较小

堆

一个可以从低地址向高地址动态增长的内存空间，用于应用程序动态分配内存。

一般由程序员分配释放，并指明大小，堆被程序申请使用的内存在被主动释放前一直有效。堆需要由由程序员手动释放，不及时回收容易产生内存泄露。程序结束时可能由操作系统回收。
栈是存放在一级缓存中的，而堆则是存放在二级缓存中的，堆的生命周期由虚拟机的垃圾回收算法来决定（并不是一旦成为孤儿对象就能被回收），所以调用这些对象的速度要相对来得低一些，故堆的速度慢于栈的速度
与数据结构中的堆是不同的，分配方式类似于链表（空闲链表法），堆是向高地址扩展的数据结构，是不连续的内存区域，这是由于系统是用链表来存储空闲内存地址的，自然是不连续的，而链表的遍历方向是由低地址向高地址。堆的大小受限于计算机系统中有效的虚拟内存。由此可见，堆获得的空间比较灵活，也比较大。

区别

空间分配：栈由操作系统自动分配释放；堆一般由程序员分配释放
申请效率对比：栈使用一级缓存，被调用时通常处于存储空间中，调用后被立即释放；.堆使用二级缓存，生命周期与虚拟机的 GC 算法有关，调用速度相对较低。
申请大小的限制：栈是向低地址扩展的数据结构，是一块连续的内存的区域；堆是向高地址扩展的数据结构，是不连续的内存区域

Operating System

This post is licensed under CC BY 4.0 by the author.