笔记-编程-IO模型
1. 简介
常用IO模型
1) 同步阻塞IO(Blocking IO)
2) 同步非阻塞IO(Non-blocking IO)
3) IO多路复用(IO Multiplexing)
4) 异步IO(Asynchronous IO)
5) 信号IO
注:这里主要讨论的是网络IO,linux和windows下有所不同,不过原理是相似的;
1.1. 相关概念
- 同步/异步
同步指前后两件任务,有严格的顺序一致性;
异步对顺序的要求和依赖关系没那么强;
- 阻塞/非阻塞
阻塞:请求-响应比较耗时,如IO
非阻塞:请求-响应比较迅速,如没有等待IP完成就直接返回状态
2. IO模型
2.1. 阻塞IO
用户线程在读写时被阻塞
数据拷贝指请求到的数据先存放在内核空间, 然后从内核空间拷贝至程序的缓冲区
缺点在于如果数据没有就绪,就会一直阻塞在read方法处。
2.2. 非阻塞IO
用户线程不断发起IO请求. 数据未到达时系统返回一状态值; 数据到达后才真正读取数据,用户线程每次请求IO都可以立即返回;
缺点在于需不断轮询,无谓地消耗了大量的CPU,一般很少直接使用这种模型,而是在其他IO模型中使用非阻塞IO这一特性
2.3. IO多路复用
使用一个线程去轮询多个socket状态,只有socket真正有读写事件时,才真正调用实际的IO读写操作,相比非阻塞,大大减少了资源占用。
一旦事件响应体很大,就会导致后续的事件迟迟得不到处理,并会影响新的事件轮询。
2.4. 异步IO
异步IO才是最理想的IO模型。
相比于IO多路复用,异步IO并不常用,因为目前操作系统对异步IO的支持并不完善,IO多路复用也基本够用. 有很多做法是用IO多路复用模型模拟异步IO(IO事件触发时不直接通知用户线程,而是将数据读写完毕后放到用户指定的缓冲区中)。
JDK7已经支持了AIO, netty采用过又放弃了, 据说是性能并没有多路复用好.
2.5. 信号驱动IO模型
当用户线程发起一个IO请求操作,会给对应的socket注册一个信号函数;
然后用户线程继续执行,当内核数据就绪时,会发送一个信号给用户线程,开始IO操作;
一般用于UDP中,对于TCP套接口几乎没用的,原因是该信号产生的过于频繁,并且该信号的出现并没有告诉我们发生了什么事情。