0%

深入浅出——理解进程、线程和协程

一、进程

1、概念
简单地来说,一个程序在运行后,就会产生一个进程。
这个进程拥有独立的内存空间,有自己的堆栈,上级挂靠单位是操作系统。
所以进程是操作系统分配系统资源(CPU时间片、内存等)的最小单位。
一个进程可以有多个线程,但至少包含一个线程。

2、进程的状态转换

1) 创建——就绪
一个程序在编译好后,开始执行,这fctf时操作系统会为程序创建一个空白的进程控制块(PCB),并向PCB中填写用于控制和管理进程的信息,然后为该进程分配运行时所必须的资源,最后,把该进程转入就绪状态并插入到就绪队列中。

2)就绪——运行
对于就绪状态的进程(即有执行资格,没有执行权的进程),如果是多个,操作系统会先给它们排个队,然后由进程调度程序按一定的选定策略,去选择一个就绪的进程,为它分配处理机(CPU+主存储器+输入/输出接口)后,进程就从就绪状态变成了运行状态。

3)运行——阻塞
正在执行的进程因发生某等待事件而无法执行,如磁盘I/O,则进程由执行状态变为阻塞状态,如进程提出输入/输出请求而变成等待外部设备传输信息的状态,进程申请资源(主存空间或外部设备)得不到满足时变成等待资源状态,进程运行中出现了故障(程序出错或主存储器读写错等)变成等待干预状态等。

4)阻塞——就绪
处于阻塞状态的进程,在其等待的事件已经发生,如输入/输出完成,资源得到满足或错误处理完毕时,处于等待状态的进程并不马上转入执行状态,而是先转入就绪状态,然后再由系统进程调度程序在适当的时候将该进程转为执行状态;

5)执行——就绪
正在执行的进程,因时间片用完而被暂停执行,或在采用抢先式优先级调度算法的系统中,当有更高优先级的进程要运行而被迫让出处理机时,该进程便由执行状态转变为就绪状态。

3、进程的通信方式(IPC)
管道(Pipe)、命名管道(FIFO)、消息队列(Message Queue) 、信号量(Semaphore) 、共享内存(Shared Memory);套接字(Socket)。

二、线程

线程,有时被称为轻量级进程(Lightweight Process,LWP),是操作系统调度(CPU调度)执行的最小单位。

三、进程和线程对比

1、进程和线程的区别

  • 线程是调度和分配的最小单位,进程是操作系统分配系统资源(CPU时间片、内存等)的最小单位;
  • 进程和线程都可以并发执行;
  • 拥有的资源不同:进程拥有一个独立单位的系统资源,而线程没有,线程只会用分配给进程的资源。
    进程是拥有资源的一个独立单位,线程不拥有系统资源,但可以访问隶属于进程的资源。进程所维护的是程序所包含的资源(静态资源), 如:地址空间,打开的文件句柄集,文件系统状态,信号处理handler等;线程所维护的运行相关的资源(动态资源),如:运行栈,调度相关的控制信息,待处理的信号集等;
  • 进程切换比线程消耗要大,进程挂了线程也都跟着挂掉
    在创建或撤消进程时,由于系统都要为之分配和回收资源,导致系统的开销明显大于创建或撤消线程时的开销。但是进程有独立的地址空间,一个进程崩溃后,在保护模式下不会对其它进程产生影响,而线程只是一个进程中的不同执行路径。线程有自己的堆栈和局部变量,但线程之间没有单独的地址空间,一个进程死掉就等于所有的线程死掉,所以多进程的程序要比多线程的程序健壮,但在进程切换时,耗费资源较大,效率要差一些。

一个形象的例子解释进程和线程的区别

假如我们把整条道路看成是一个“进程”的话,那么图中由白色虚线分隔开来的各个车道就是进程中的各个“线程”了。
这些线程(车道)共享了进程(道路)的公共资源(土地资源)。
这些线程(车道)必须依赖于进程(道路),也就是说,线程不能脱离于进程而存在(就像离开了道路,车道也就没有意义了)。
这些线程(车道)之间可以并发执行(各个车道你走你的,我走我的),也可以互相同步(某些车道在交通灯亮时禁止继续前行或转弯,必须等待其它车道的车辆通行完毕)。
这些线程(车道)之间依靠代码逻辑(交通灯)来控制运行,一旦代码逻辑控制有误(死锁,多个线程同时竞争唯一资源),那么线程将陷入混乱,无序之中。
这些线程(车道)之间谁先运行是未知的,只有在线程刚好被分配到CPU时间片(交通灯变化)的那一刻才能知道。

2、进程和线程的联系

  • 一个线程只能属于一个进程,而一个进程可以有多个线程,但至少有一个线程;
  • 资源分配给进程,同一进程的所有线程共享该进程的所有资源;
  • 处理机分给线程,即真正在处理机上运行的是线程;
  • 线程在执行过程中,需要协作同步。不同进程的线程间要利用消息通信的办法实现同步。

四、进程/线程之间的亲缘性

亲缘性的意思是指进程/线程只在某个cpu上运行(多核系统),比如:

1
2
3
4
5
6
7
8
BOOL WINAPI SetProcessAffinityMask(
_In_ HANDLE hProcess,
_In_ DWORD_PTR dwProcessAffinityMask
);
/*
dwProcessAffinityMask 如果是 0 , 代表当前进程只在cpu0 上工作;
如果是 0x03 , 转为2进制是 00000011 . 代表只在 cpu0 或 cpu1上工作;
*/

使用CPU亲缘性的好处:设置CPU亲缘性是为了防止进程/线程在CPU的核上频繁切换,从而避免因切换带来的CPU的L1/L2 cache失效,cache失效会降低程序的性能。

五、协程

协程,是一种比线程更加轻量级的存在,协程不是被操作系统内核所管理,而完全是由程序所控制(也就是在用户态执行)。这样带来的好处就是性能得到了很大的提升,不会像线程切换那样消耗资源。

子程序,或者称为函数,在所有语言中都是层级调用,比如A调用B,B在执行过程中又调用了C,C执行完毕返回,B执行完毕返回,最后是A执行完毕。所以子程序调用是通过栈实现的,一个线程就是执行一个子程序。子程序调用总是一个入口,一次返回,调用顺序是明确的。而协程的调用和子程序不同。

协程在子程序内部是可中断的,然后转而执行别的子程序,在适当的时候再返回来接着执行。

六、线程与协程的区别

协程的特点在于是一个线程执行,那和多线程比,协程有什么优势呢?
1、极高的执行效率
因为子程序切换不是线程切换,而是由程序自身控制,因此,没有线程切换的开销,和多线程比,线程数量越多,协程的性能优势就越明显;
2、不需要多线程的锁机制
因为只有一个线程,也不存在同时写变量冲突,在协程中控制共享资源不加锁,只需要判断状态就好了,所以执行效率比多线程高很多。

总结

一个进程内部可以运行多个线程,而每个线程又可以运行很多协程。线程要负责对协程进行调度,保证每个协程都有机会得到执行。当一个协程睡眠时,它要将线程的运行权让给其它的协程来运行,而不能持续霸占这个线程。同一个线程内部最多只会有一个协程正在运行。

趣解:进程就好比是孙悟空,孙悟空拔了一根汗毛(起了一个线程),变幻出很多天兵天将(协程),但是,如果要是跟妖怪们打架,同一时间只有一个天兵天将(协程)在跟妖怪们打,打累了就换别的天兵天将上,或者说别的天兵天将还没有准备好兵器,先准备好随时准备接力。

参考:
https://blog.csdn.net/daaikuaichuan/article/details/82951084
https://blog.csdn.net/IT_10/article/details/90174175 进程间通信方式
https://www.cnblogs.com/52fhy/p/11369028.html 理解Go协程与并发