Bootstrap

『 Linux 』网络传输层 - TCP(四)


滑动窗口

在博客『 Linux 』网络传输层 - TCP(三)中提到了滑动窗口的大致;

滑动窗口在TCP任意一端的发送缓冲区中,发送缓冲区通常分为以下部分:

  • 已发送已确认

    表示已经发送且已经接收到对端对该数据的ACK应答报文的数据,该区域中的数据可以被上层新写下来的数据覆盖;

  • 已发送未确认

    表示已经发送,但对端并未对该数据段进行返回ACK报文;

  • 可立即发送

    表示可以立即发送出去的数据;

  • 待发送

    这个区域中的数据是未发送的数据,而且未被允许可以立即发送;

其中滑动窗口区域即为 (可立即发送/已发送未确认) 区域中;

图中实际上标志着四个位置,其中第四个位置表示为 “空” 通常情况下发送缓冲区并不会所有位置都存在数据,保留一定位置可以避免发送缓冲区溢满;

本质上对于滑动窗口而言可以视为一段空间通过前后两个指针方式的滑动从而进行滑动,通过调整指针位置来动态调整滑动窗口大小;

为了提高网络通信的效率,通常TCP采用了将串行发送变为串行与并行相互结合的方式进行数据发送;

所谓的并行发送即为发送方一次性将多个TCP数据段发送给对端从而提高单次IO的吞吐量从而提高效率;

而为了避免接收方因为接收缓冲区可用空间不足导致的大面积丢包故采用滑动窗口;

通常情况下滑动窗口的大小等于对端接收缓冲区的接受能力,无论如何滑动窗口的大小都不能超过对端接收缓冲区当前的接受能力;

接收缓冲区中也同样存在一个窗口,被称为 “接收窗口” ,这个接收窗口表示在该连接中接收方的接收能力;

接收缓冲区通常由三个部分组成:

  • 已接收已处理数据

    表示已经接收并已经被上层处理并发送对应的ACK应答报文的数据区域,这段数据区域在需要的时候将会被 “可用空间” 部分划走,作为该空间的一部分;

  • 已接收未处理数据

    该区域中的数据表示TCP接收的数据,但上层并未将该数据取走并未处理的数据;

  • 可用空间(接收窗口)

    这个位置的空间通常表示当前可用空间,即接收窗口,当该段空间不足时将会把已接收已处理数据区域中被视为已经释放的区域作为可用空间以增加接收窗口大小;

同样的接收缓冲区中同样存在空区域,这个区域同样不存在任何数据;


滑动窗口与数据丢包

通常情况下TCP数据的发送是采用串行与并行配合使用的,即根据TCP所评估的网络健康状态,TCP适当的调整数据发送策略,用串行发送数据还是并行发送多个数据段,无论是哪种方式都可能出现丢包的问题;

而滑动窗口是根据发送方发送数据段后接收方返回的ACK报文中窗口大小直接相关的;

发送方的丢包问题会导致接收方无法返回ACK报文使得发送方无法立即将滑动窗口向右滑动;

这里也涉及到序列号与确认序列号的问题,确认序列号的定义是:

  • 确认序号前的所有序号的报文都以接收到

假设发送方以并行的方式发送多个数据段,其中一个数据段丢包了,滑动窗口通常根据对端所发送的报文的确认序列号进行更新,以下图为例:

当发送方向接收方并行发送三个报文分别为1001~2000,2001~30003001~4000三个报文,对应的滑动窗口预期将根据对端所发送的ACK应答报文更新到4001的部分,而因为对应的因为出现丢包问题,窗口只能收到确认序号为2001ACK应答报文,对应的当前滑动窗口也只更新到2001;

当对端接收到了1001~20003001~4000两个报文时因为序号相差,未接收到序号为2001的报文,将会重复发送确认序号为2001ACK报文返回给发送端,多次发送,当发送方接收到三个确认序号相同的报文时会判断该报文已经丢失从而触发快速重传,当接收方接收到对应的数据段时对应的会直接发送确认序号为4001ACK报文表示在此之前的数据包已经接收到,对应的发送方的滑动窗口将直接更新到确认序号4001ACK报文中的窗口大小位置,不会经过确认序号为3001的窗口大小位置;

这里滑动窗口滑动至4001位置并不代表实际上滑动到4001的位置,而是滑动到确认序列号4001ACK报文的窗口大小位置;

确认序号的存在保证了滑动窗口将会线性并且连续的向后更新,不会出现跳跃某个丢包报文的情况;


滑动窗口的移动

滑动窗口的移动通常存在几个问题:

  • 滑动窗口移动的方向
  • 滑动窗口移动时大小的变化

通常情况下,滑动窗口只会向右移动,并不会向左移动;

对于TCP的发送缓冲区而言,其设计的思路是一种类似于以数组为例的逻辑环状结构;

代表滑动窗口的范围的两个指针只会向右移动不会向左移动(滑动窗口指针的移动是不可逆的),当滑动窗口到达发送缓冲区的末尾时将会以环状的方式由最右变为最左(一次环绕);

不仅如此,发送缓冲区中的所有区域都会按照逻辑环状移动,因为整个发送缓冲区在逻辑上就是环形的;

对于第二个问题而言,滑动窗口是一个动态的窗口,将会根据接收方所返回的ACK应答报文中的窗口大小实时更新滑动窗口的大小;

通常滑动窗口的大小变化将会存在三种情况:

  • 变大

    当接收方上层处理速度较快时,即处理速度大于接收速度时,意味着接收缓冲区中更多的数据会被划分为 “已接收已处理” 区域,而该区域在数据被处理完后适当的空间将被释放,被划为当前缓冲区可用空间大小,这也意味着接收窗口会变大;

    而通常情况下滑动窗口是根据接收窗口大小进行变化的,当发送方接收到了对端的ACK应答报文后将会更新滑动窗口为较新的较大的大小;

    更新可能是将一批新的数据段发送给接收方,也可能是将一段数据划分为可立即发送的区域;

  • 变小

    当接收方上层处理速度慢于接收速度时,表示随着发送方所发数据,接收缓冲区将越来越小,对应的接收窗口也会越来越小;

    对应的返回的ACK报文的窗口大小也会变小从而导致滑动窗口变小;

  • 不变

    当接收方上层处理速度趋于接收速度时,即接收速度与处理速度相当时,接收窗口不会变化,对应滑动窗口也不会变化;

通常情况滑动窗口的范围可以通过确认序列号和双指针来进行抽象理解;

可以把滑动窗口的范围视为两个指针,如begin指针以及end指针,其中begin看作滑动窗口的开始,end表示滑动窗口的结束部分;

begin指针所指向的部分为一批接收方返回的ACK报文的最后一个报文的 确认序列号 ;

end指针所指向的位置为 确认序列号+ACK报文的窗口大小 ;

通常情况下实际的窗口大小为 窗口大小和有效数据 中的较小值;

  • 流量控制是根据滑动窗口的大小变化进行控制的

TCP的序列号和确认序列号

通常情况下双端在使用TCP协议进行通信时都要交换对应的序列号;

因此序列号并不是从0开始的,通常双方的初始序列号是一组随机值;

通常情况下数据都将存在网络中,而残存在网络中的数据将可能因为序列号相同从而影响双方通信中数据的可靠性;

通过随机序列号可以一定程度避免网络残存数据因序列号相同从而降低双方网络通信的可靠性;

通常初始序列号的协商在三次握手中进行;

序列号既保证的数据按序到达,也可以将误重发的多个序列号相同的TCP报文进行去重;


延迟应答

采用TCP协议进行通信时,通信的双端都是平等的,双端各存在对应的发送缓冲区和接收缓冲区;

每一端都遵从着数据由一端的发送缓冲区通过网络发送给对端的接收缓冲区;

无论是网络还是系统中,通常在进行数据交互时单次IO的吞吐量越大对应的数据交互效率越高;

在网络通信中,即发送方一次发送更多的数据对应的效率就越高;

但由于硬件限制,发送方无法一次性发送大块的数据块,尤其是在TCP通信中,数据是以TCP报文的形式,以一个个的数据段的形式将数据进行发送;

由于无法一次性发送较大的数据块,TCP在数据交互时采用了其他的方式,即 延迟应答 ;

通常情况下在进行TCP网络通信时,为了保证可靠性,接收方在接收到发送方所发送的数据后必须向发送方返回一个带有对应确认序列号用于应答的ACK报文,而如果对每一条TCP报文都进行应答会造成既使得双方通信效率不高,也可能因为报文的丢失触发重传导致通信效率更加降低;

延迟应答即接收方在接收到发送方所发的数据段后可以不立即对该数据段进行ACK应答,而是等待接收到多几条数据段后统一进行ACK应答,由于确认序列号的定义为该确认序列号之前的所有序号的报文都已经被接收,故接收方将只返回多个TCP报文中的最后一个报文的ACK应答,从而间接提高IO的吞吐量;

需要注意,虽然接收方以延迟应答的方式只对最后一条数据段进行ACK应答,但作为接收方仍可以根据所接收的TCP报文中的序列号来判断发送方所发数据段是否出现丢包;

  • 延迟应答与超时重传

    通常情况下延迟应答与超时重传这类需要进行定时才能进行的动作都会被设置一个定时任务(类似定时闹钟);

    而为了避免发送方触发超时重传导致无意义的重传,延迟应答的定时任务通常要小于超时重传的定时任务;

通常情况下,在延迟应答期间,发送方的滑动窗口不会立即更新,因为它依赖于接收方ACK应答中的窗口大小来进行窗口的滑动,因此发送方可能会继续发送数据直到滑动窗口的限制;

一旦接收方决定发送ACK应答报文(接收方接收到足够多的数据段或者延迟应答的定时任务到期)时将通过ACK报文来更新发送方的滑动窗口;

发送方在接收到对应的ACK报文后将移动滑动窗口,从而继续发送更多的数据;

延迟应答中也会有一些特殊情况:

  • 及时ACK的需求

    在某些情况,比如接收方所接收到的数据段是乱序的,或者接收方的缓冲区接近满了将会立即发送ACK应答报文以便及时通知发送方调整发送策略;

通常情况下,延迟ACK机制会在以下条件下触发:

  • 收到两个完整的TCP报文段
  • 延迟定时器到期(通常为200ms)

通常情况下这两个条件的关系是 “或” 的关系,即只要有一个触发则接收方返回ACK应答报文;

延迟应答只是进行延迟应答,并不影响上层对数据的读取,对应的所谓的收到两个完整的TCP报文也包括被上层读取处理的数据段,即无论数据段是否被上层读取,当接收到两个完整的TCP后接收方将返回ACK应答报文;

通常情况下上层的数据处理与传输层TCP接收数据是不冲突的,在进行延迟应答时上层同样在获取数据,同样的数据将会被处理后接收方在返回ACK报文时将会更新窗口大小,此时的缓冲区中这些被上层取走的数据将被划分为 “已接收已处理” 区域,对应的接收方窗口大小可能也会进行更新;

通常情况下延迟应答不仅增大了网络IO单次IO吞吐量,同样的为了提高效率接收方也在博概率,这里所博的概率为上层有足够能力将较多或者延迟应答时所接收的数据取走并进行处理从而腾出更多的缓冲区空间来让接收方的窗口变得更大;

TCP是一种传输控制协议,通常数据的传输与上层获取并处理数据并没有直接关系,为了使得程序能灵活使用TCP的延迟应答机制,在进行程序时通常推荐的做法为每次都通过read()或是recv()将接收缓冲区中的数据从内核中获取到应用层,同时将数据从接收缓冲区获取到应用层也可以使得接收方能够尽快向发送方发送ACK应答来更新更大的滑动窗口从而提高数据交互的效率;


拥塞控制

TCP协议利用了一系列策略来使得网络通信中既具有可靠性也能够提高性能,其中和可靠性有关的特性为:

  • 校验和

    用于验证数据完整性;

    每个TCP报文都包含一个校验和字段,发送方计算报文的校验和,接收方接收到数据后会进行校验以确保数据在传输过程中未被损坏;

  • 序列号(按序到达)

    序列号确保所有数据按照正确的顺序到达接收方,即使数据段是乱序到达的,接收方也可以根据序列号来重新排序数据段并进行一定程度的去重(对相同序列号的报文);

  • 确认应答

    每个接收到的数据段都会被确认,接收方通过ACK告知发送方哪些数据已经成功接收;

  • 超时重传

    如果发送方在合理时间内为收到ACK报文则会判断这段数据段可能在网络中丢失将会重传数据段;

    在众多的重传机制中超时重传是唯一一个用于兜底的,即在连接正常时确保数据一定发送至接收方;

  • 连接管理

    TCP使用三次握手建立连接,使用四次挥手断开连接,所建立的连接将以一种特定的数据结构被管理在一起,确保连接的可靠性和一致性;

  • 流量控制

    通过窗口大小的调整,TCP确保不会发送超过接收方接受能力的数据量,防止网络拥塞以及接收方因为接收缓冲区溢满导致的大面积丢包问题;

和效率有关的特性为:

  • 滑动窗口

    允许发送方在收到ACK之前根据窗口大小发送多个数据段,提高了网络利用率和传输效率;

    滑动窗口机制是TCP流量控制的重要部分;

  • 快速重传

    当接收方检测到数据丢失时,他会发送重复的ACK,发送方在收到多个(通常为三个)确认序号相同的ACK报文后将会判定该数据丢失从而立即重传丢失的数据段,而不必等待超时重传;

  • 延迟应答

    延迟应答以减少ACK报文的总数,减少网络负担的同时也在博接收方上层尽快将内核缓冲区中数据取走的概率;

  • 捎带应答

    当发送方在发送数据时携带对之前收到的数据段的确认信息,将需要发送给对方的数据段与对端上一条发送的数据的ACK应答相结合从而减少独立的ACK报文发出从而提高效率;

但实际上上述的这些策略更多的是考虑网络通信时双端的通信策略,在实际通信过程中所有数据都是需要经过网络的,而网络并不是任何时候的状态都是好的,所以为了保证通信时的可靠性,TCP协议在进行网络通信时也需要对网络进行评估,根据不同的网络健康状态作一定的策略,即 拥塞控制 ;

在进行数据通信时可能出现两种情况:

  • 双方任意一端或双方主机出现问题
  • 网络出现问题

以丢包为例,当双方进行数据通信时出现了少量的丢包可能表示是常规情况,因为TCP协议虽然保证可靠性,能够将丢包的数据进行重传,但仍避免不了丢包,但若是出现了大量的丢包情况,TCP协议将会视为网络出现问题,即 “网络拥塞” ;

当出现了网络拥塞时发送方通常不能进行立即重发,网络拥塞表示网络中的数据段十分多,而如果立即对数据进行重发则会加重网络拥塞问题;

在TCP网络通信时,并不是只有一对客户端服务端,而是有若干个客户端服务端在共同使用TCP/IP协议进行网络通信,而网络资源本身就是共享资源,当某一时刻网络通信数量达到峰值则可能出现网络拥塞问题;

而为了避免出现更加严重的网络拥塞问题,TCP协议的策略通常为在判断为网络拥塞的情况时使得所有使用TCP协议通信的机器达成一个共识 —— “减少数据发送” ;

这同样是博概率,因为并不是所有使用TCP协议进行通信的机器都会视为当前网络出现"网络拥塞";

TCP引入了 “慢启动” 机制,在发生网络拥塞的情况时减少数据段数量发送,根据当前的网络拥塞状态再决定以怎样的速度进行数据传输;

TCP定义了一个新的窗口,即 “拥塞窗口(Congestion Window, cwnd)” ;

在第一次发送数据时拥塞窗口的大小通常为1MSS,随后没收到一个ACK应答报文时拥塞窗口将逐渐以指数级的方式慢慢增长1,2,4,8,16...;

在上文中提到 “滑动窗口的大小等于对端接收缓冲区的接受能力” , 而实际为:

  • 滑动窗口大小为拥塞窗口与接收方接受能力的较小值

每次发送数据包时,将拥塞窗口和接收方主机端所反馈的窗口大小作比较,去较小值作为实际的发送窗口;

这里TCP必须考虑两个问题,对端的接受能力和网络的健康状态,单凭一个条件无法使发送端发送大量数据段给对端,因为可能当对方接受能力较强的情况时网络出现拥塞,也可能网络健康状况良好但对端接受能力弱;

而拥塞窗口即为主机判断网络健康状态的指标,如果发送数据超过拥塞窗口则可能引发网络拥塞;

网络是动态的,对应的它的健康状态也是动态的,因此拥塞窗口也应该是动态的,通常情况下拥塞窗口有两种状态:

  • 慢启动阶段

    • 开始阶段

      当TCP连接开始或在检测到拥塞后重新开始时,拥塞窗口通常初始化为1MSS(最大段大小);

      在这个阶段cwnd以指数方式增长,每收到一个ACK报文,cwnd都会增大,通常为每个RTT(数据包从发送方传输到接收方并返回到发送方所需的时间)内cwnd翻倍;

      这种指数增长的目的是快速探测网络可用带宽;

    • 慢启动结束

      cwnd达到慢启动门限(ssthresh)时,慢启动阶段结束;

      进入拥塞避免阶段继续增长;

  • 拥塞避免阶段

    • 线性增长

      cwnd达到ssthresh后,cwnd的增长由指数增长变为线性增长;

      在每个RTT中,cwnd通常增加1MSS或较小的固定值;

      以更为谨慎的增长方式避免潜在的网络拥堵;

    • 持续增长

      在没有任何拥塞信号(如丢包或者收到重复ACK报文)情况下,cwnd会继续线性增长;

当TCP检测到网络拥塞时(通常是通过丢包或者收到重复ACK报文),将减少cwnd,通常会减半,同时ssthresh设置为当前cwnd的一半;

cwnd的减少是为了立即减少网络负载以缓解网络拥塞,之后TCP重新进入慢启动阶段,逐步探测新的可用带宽;

当TCP连接被重置时,由于连接断开重新连接,重新进行三次握手,对应的cwnd也会回归初始值;

同样当出现超时现象时,即TCP一端没有在有效时间内接收到对端的ACK报文,触发超时重传事件则表示可能发生严重的网络拥塞,因此在这种情况下cwnd将会重置到1MSS大小,然后重新进入慢启动状态;


面向字节流

TCP是一个面向字节流的通信协议,在TCP中数据被看作是一个无结构的字节流,这意味着传输的单位是字节而不是较高层协议所使用的消息,记录或者数据包;

应用程序将数据交给TCP,通常采用的方式为write()或者send(),TCP负责将这些字节流分割成适合网络通信的大小,然后在接收端重新组装这些字节以供应用层进行处理;

TCP不像UDP那样保留应用程序数据的消息边界;

如果应用程序在一次发送调用中发送了数据,接收方可能需要多次接收调用才能读取这些数据,反之亦然;

这意味着发送方发送的字节流可以被接收方以不同于发送时分割的数据块进行接收;

同时TCP是属于传输层协议,与应用层协议是无关的,因为面向字节流,应用层所发的数据将可能被TCP分割为若干个较小数据块进行传输,而在接收方的上层也只需要负责接收数据并将数据组成应用层所需的大小;

就如购买大件商品时买家和卖家的关系一样;

大件商品不适合传输所以拆分成适合传输的大小,当所有部件到齐时进行组装,在上层的买家与买家所接触的商品皆为完整的商品,拆分与传输工作则交给下层处理;

应用层缓冲区将数据通过write()send()拷贝到内核缓冲区,TCP只认识字节而不认识也不关心数据整体,以字节的方式进行传输,到达对端接收缓冲区时对端应用层通过read()recv()将已经到达内核缓冲区的数据读取到上层进行组装,实际上应用层所发送和接收的都是完整的数据,TCP则是以字节流的方式进行传输,像流动一样,所以是"字节流";

面向字节流的优点为如下:

  • 灵活性

    因为TCP不关心应用层的消息结构,应用程序可以动态调整发送数据的大小和频率而不需担心传输层处理数据的方式细节;

  • 可靠性

    TCP提供可靠传输,确保所有字节按序到达并无丢失,若某些字节丢失或出错,TCP会负责重传;

  • 流量控制

    TCP可以根据网络状况自动调整传输速率以防止拥塞,确保数据流的平稳性;


粘包问题与拆包问题

TCP协议是面向字节流协议,而面向字节流协议通常会出现一种问题,即接收方应用层对内核缓冲区数据进行读取的问题,通常有三种情况:

  • 读取完整报文
  • 读取不完整报文
  • 读取过量报文

其中读取完整报文是正常情况,读取不完整报文则为"拆包问题",对应的读取过量报文则是"粘包问题";

这张图中展示了常见的问题;

首先理想情况下所接收的两个数据包独立,没有问题;

第二个为拆包问题,即在读取后所读取的数据包不是完整的数据包;

第三个为粘包问题,即在读取数据中过量读取将两个数据包当做一个数据包读取;

第四个与第五个都为粘包/拆包问题,即两个数据包其中一个数据包拆包,拆包的另一部分与另一个数据包又出现了粘包问题;

  • 粘包问题

    粘包问题指多个应用层报文在一次TCP传输中被合并在一起,接收方读取操作中收到多个报文的数据;

  • 拆包问题

    拆包问题指的是一个应用层报文在传输过程中被分成多个TCP数据段,接收方需要多次读取才能重组完整的报文;

由于TCP协议是面向字节流进行数据传输的,所以实际上在进行数据读取等问题都为应用层需要解决的问题;

通常解决的办法则是在应用层定一个协议来对拆包与粘包问题进行处理;

常见的解决问题为如下:

  • 拆包问题

    • 使用长度字段

      在应用层报头中采用长度字段,通过长度字段来指示报文的总长度,接收方应用层根据长度字段多次读取直到完整报文收集完毕;

    • 状态机管理

      在接收端使用状态机来管理数据片段的累积和完整报文的组装;

  • 粘包问题

    • 使用分隔符

      在每个报文之间插入特殊的分隔符,接收方使用分隔符来分割数据流;

    • 长度字段

      类似于拆包的解决方案,长度字段可以帮助接收方解析多个连续的报文;


TCP异常情况

TCP连接的异常情况分为几种,如进程终止,机器重启,机器断掉或者网络断开;

  • 进程终止

    对于操作系统而言,进程终止就是单纯的进程结束,无论该进程是异常退出还是正常关闭;

    而TCP的连接是和套接字描述符直接相关的,对应的该进程的套接字描述符的生命周期又是伴随进程的,间接来说TCP的连接是与进程的生命周期相关的;

    任何进程都是独立的,TCP连接也想通,对于操作系统而言,操作系统不会希望一个模块的关闭影响另一个模块,因此当一个使用TCP协议进行网络通信的进程因任何原因关闭,对应的TCP连接都会正常进行四次挥手从而正常关闭连接;

  • 机器重启

    机器重启与机器关闭本质上与进程终止相同,因为机器无论是进行重启还是关闭,在完全关闭或者关机重启前都必须要做的一个工作就是杀掉所有的进程;

    因此上面提到的 “当一个使用TCP协议进行网络通信的进程因任何原因关闭,对应的TCP连接都会正常进行四次挥手从而正常关闭连接” 同样适用于该异常情况;

  • 机器断电/物理断网

    在上面的两个例子中无论是进程终止还是机器关机重启,对应的都会直接或者间接进行四次挥手从而关闭连接;

    而若是机器断电的情况下,操作系统无法立即与对端进行四次挥手,与物理断网相同,但实际上本端已经无法入网,这就导致了双方连接认知不一致的问题,即本端认为连接已经断开,但对端确认为未进行四次挥手所以连接正常;

    而为了避免一端长时间维护着一个完全不活跃的连接,TCP提供了一种Keep-Alive机制,这种机制可以帮助检测连接是否存在,通过周期性的发送探测数据包来检测连接状态;

    如果开启了Keep-Alive,对端会在长时间没有通信后发送探测包,如果没有收到响应,则认为连接中断,将不再维护该连接;

    同时解决办法还有以下两种:

    • 应用层超时设置

      通常应用层会设置自己的超时机制,如果在预定时间内没有收到需要的彗星,应用层就会认为连接已经断开,这可以通过设定应用层心跳或者超时重传机制来实现;

    • TCP重传机制

      TCP协议会尝试重传未被确认的分组,如果在多次尝试后仍未收到ACK,则报告连接错误;


如何利用UDP实现可靠传输(经典面试题)

UDP协议本身是不可靠的协议(不保证消息的交付,顺序以及完整性),但可以通过在应用层实现一定的机制来模拟TCP的可靠性;

通常情况下若是在不需要使用TCP协议又要保证可靠传输的场景中,这类场景则表示需要TCP中的部分的可靠性策略,可以根据不同的实现场景在应用层引入TCP的一些可靠性策略;

举两个简单的例子:

  • 在线聊天室

    在一个在线聊天室中,消息的传递需要可靠,但对实时性要求不如实时音视频那样苛刻;

    若是使用UDP协议并在应用层实现可靠性可以引入下面的策略:

    • 消息确认

      每条消息都带有一个唯一的序列号;

      接收方在收到消息后,发回一个带有相同序列号的ACK确认;

      发送方在发送消息后启动一个定时器,如果超时时间内未收到ACK则重传该消息;

    • 重传策略

      重传次数限制: 设置一个最大的重传次数,超过次数则放弃重传,并通知用户发送失败;

      递增的重传间隔: 每次重传的间隔时间可以逐渐增加,以减少对网络的冲击从而降低网络拥塞;

    • 顺序控制

      接收方根据消息的序列号对消息进行排序,确保按正确顺序显示给用户对应的消息;

      可以使用缓冲区来暂存乱序到达的消息,待缺失消息到达后再按照顺序呈现;

  • 文件传输应用

    在一个文件传输应用中,最终要的则是保证文件的完整性和顺序性,因此可靠性要求较高;

    可以引入以下策略:

    • 分块传输

      将文件分割成固定大小的块,每个块带有代表顺序的序列号;

      发送方逐块发送文件,并等待每块文件的ACK应答;

    • 校验和

      每个数据块附带一个校验和,用于接收方验证数据块的完整性;

      如果校验和不匹配,接收方请求重传该数据块;

    • 滑动窗口

      允许发送方在没有收到ACK的情况发送多个数据块,但总数不能超过窗口的大小;

      接收方在处理完一个完整的窗口内的所有数据块后,统一发送批量ACK应答;

    • 超时和重传

      实现超时重传机制,如果在设定时间内未收到ACK,则重传该数据块;

      动态调整超过时间,根据网络状况进行优化传输;

;