Bootstrap

--- UDP和TCP传输协议 ---

UDP是 无连接的 面向数据报 不可靠传输  全双工的传输协议

TCP是 有连接   面向字节流  可靠传输  全双工的传输协议

对于这些名词在这里解释下

有无连接:在交流时会不会保留对方的信息比如端口号 ip,如果会保留是有连接,不会保留是无连接

面向数据报:数据发送的最小单位是一个数据包,在读取时也是最少读取一个数据报

面向字节流:最小的发送和读取数据的单位是字节

可靠不可靠传输:在传输数据时可靠传输会通过一系列的机制来尽可能的使数据完整的到达对方,即使有丢包对方也能够知道,接收方也能知道数据是否到达了对方, 而不可靠传输并不会管这么多,只是将数据发送出去就不管了

全半双工:一个数据链路,可同时读写操作,而半双工只能进行其中的一种操作

UDP协议的构成

                          头部 (一共8byte)

             16位源端口号               16位目的端口号

              16位UDP校验和                  16位UDP长度

                数据

源端口号是发送方的端口号,目的端口号是接收方的端口号,记录了这个程序从哪里发出,到哪里接收

udp长度表示了数据包有多大,是头部和数据总和

校验和,用来确保数据包在途中没有受到更改,根据数据包的内容算出来的一个值,在接收方收到了这个数据包后再根据收到的算出来一个值,若不同那么就表示这个数据包收到了修改,会直接将他丢弃

UDP没有body部分,所有的内容都在url中,UDP的总长度是64kb,也可以理解为他的有效载荷就是64kb,这是一个1980年代的协议了,而这个数据在当时还是特别大的,但在现在看来是很小的了,现在随便的一个图片就在几MB上了,而为了适应现在,出现了更理想TCP协议

TCP协议

 构成                

                                     16位源端口号             |          16为目的端口号

                                                        32位序号

                                                         32位确认序号

                                4位首部长度   |    6位保留     |     6为标志位(ACK,SYN,FIN,RST,PSH,URG) 

                                 16位窗口大小       |   16为校验和     |          16位紧急指针

                                                                    选项  (40字节)

                                                                    数据

TCP头部的最大长读为60字节

源端口号和目的端口号表示了这个数据是中那个程序来的,要到哪个程序去

序号:表示了这个数据包在整个数据中的位置,间数据包按序号排列在读取时才能读到正确的数据

确认序号:表示收到了这序号之前的数据包,期望收到这以后序号的数据包

ACK确认号是否有效,又叫应答报文
SYN发起同步请求,建立连接,又叫同步报文段
FIN终止连接,又叫结束报文段
RST重新建立连接,又叫复位报文段
PSH告诉程序要尽快的把这个数据包从缓冲区读走
URG紧急指针是否有效

这些标志位都只有一个bit位大小,1为真,0位假

16位窗口大小:告诉接收方的窗口大小应该是多大

16位校验和:确认数据包是没有被修改过的

16为紧急指针:告诉程序在读取数据的时候要从哪个位置直接读取

选项:这个选项中有更多的可选的功能,将TCP变的更灵活了

TCP 是有连接   面向字节流     可靠传输   全双工的协议,那么为了完成这些工作,那么肯定会有一系列的机制来实现这些功能

TCP的核心机制

建立连接和断开连接

三次握手 

来个交流的主机通过三次握手来建立连接,发生的时间是在客户端创建了一个socket对象后,并调用connect方法后制动进行的,在握手时会发生如下的操作

                        

三次握手完成后就表示连接已经建立了,可以进行数据的传递了,三次握手的进行是在客户端创建了一个socket对象后,调用了connect方法会发起三次握手,服务器在调用accept方法就能得到这个连接。

三次握手的目的是投石问路,确保这条数据通道是畅通的,并确保发送方和接受方对数据的接收和发送能力是正常的,同时还会进行连接的初始化,比如秘钥的确定,传输的序列号的确定

连接断开 四次挥手

一般是客户端主动断开连接,但入过时服务器出错而导致连接的断开,那么一般是服务器出问题了

四次挥手的具体过程

为什么是四次会有而不是三次,或者说为什么不能把服务器放回的ACK和FIN合并来一起打包发送呢,因为ACK和FIN的发送是在不同时间的,ACK是在收到FIN后立刻就会发送,而FIN的发送要等服务器将最后的代码给执行了才会发送,也就是需要等到服务器调用close方法关闭连接之后才会发送,但也可以通过延时发送,将ACK等会,等到和FIN一起发送,但是这样需要自己在代码层面上实现

为什么客户端再接收到了服务器返回的FIN后不会立刻关闭连接而是要等一会,这是为了确保

服务器收到了最后发送的ACK并关闭了连接,因为如果在ACK发送后立马关闭了,如果这个ACK没有送到,那么服务器就会收不到这个ACK,对于这段时间的长度一般是2* MSL,MSL值得是在网络上任何俩个节点之间传输的最大时间,是60秒,虽然服务器在多次发送FIN到一定次数后还是没有回应,会将连接视为异常中止并会单方面断开连接节省资源

滑动窗口

数据在发送是会有个自己的序号,这个序号表示了这个数据包在整个数据中的位置,在接收方接收到这个数据后,会返回一个ack,这ack上的确认需要代表了这个序号之前的数据都被收到了,期望收到这个数据以后的数据举个例子,有段数据 1-100,在接收端接收到之后,返回的ack的确认序号是在最后的序号上加1,也就是101,在接收端收到了这个ack后就知道100之前的数据就都被收到了,但如果在1-100这个数据包被接收之前,发送端发送了的101 - 200被数据段接收到了,那么这段数据会被放到接收缓冲区中,返回的ack中的确认序号是1,告诉了发送方1(1-100)之后的还没收到,等到1-100被收到之后,返回的确认序号就是201了

在没有引入滑动窗口机制传输的话,每次数据的传输都需要收到接收方返回的ack之后才会继续发送下一个数据,但是这样的话,发送的效率太低了,于是就有了滑动窗口,他的窗口大小表示了能不等待ack放回的发送数据的最大大小,比如如果滑动窗口的大小为200,那么在发送是就会直接把1-100 和100-200这个数据包给发送出去而不会等待ack的返回,这样大大的增加了效率,窗口越大,代表数据的吞吐量越大,发送的数据的速度也就会更大

tcp中的窗口大小为16位,表示的字节数是1-65535个字节,当其实还可一更大的,在tcp的选项里有一个窗口扩大因子M,他通过将窗口大小左移M位来成倍数的扩大窗口大小

流量控制

但是窗口的大小不能无限大,数据吞吐量越大,意味着丢包的概率会大大在增加,因为如果数据量过大一下子就那接收缓冲区给打满了,那么接收方就不能在接收其他的数据了,那么其他发送的数据就都丢包了,这就失去了tcp的可靠传输性质,那么就需要对流量进行控制,也就是对发送端的窗口大小进行控制,在tcp协议中有个窗口大小的字段,在返回ack的时候会根据接收方的接受缓冲区的大小来设置这个窗口大小,来告诉发送方的窗口大小应该变为多大,如果接收缓冲区被打满了,那么这个窗口大下就是0,那么这时就不会再发送数据,但是发送方又需要知道缓冲区的情况,因为还有数据需要传输,那么发送方会定时发送一个窗口探测数据段,不携带任何数据信息,发射方通过返回的ack来决定窗口的大小

快重传

 发送端发送3个1-100,101-200,201-300数据包,1-100的数据包被接收到返回了确认序号为101的ack,而101-200的数据包丢失了,在接收方收到了201-300的数据包之后,还是会返回确认序号为101的ack表示这个数据包还没有收到,这样在接收方收到了多个确认序号为101的ack之后,就能判断出是这个包丢包了,然后对这个数据包重新发送,这就是快重传的过程

拥塞控制

tcp引入了慢启动机制,在发送数据时先少量的发送,来探探路,因为在不清楚前方数据传输链路的拥挤状况下就盲目的大数据传输,是很危险的,万一这条路正好特别忙,那么丢包的概率就大大增加了

于是在发送端有个拥塞窗口,初始大小为1,滑动窗口的实际大小是拥塞窗口和ack返回的窗口大小的最小值,在每次收到一个ack之后,拥塞窗口会翻一倍,所以拥塞窗口在初期是呈指数增长的,但在超过了一个阈值(慢启动阈值)之后会变为线性增长,每次在收到一个ack之后加一

拥塞窗口不是只会增长的,每当遇到触发了超时重传机制的话或者是严重丢包,就会将拥塞窗口给重置位1同时还会将慢启动阈值变为之前的一半,对于少量的数据丢失,只会触发快重传机制,并不会这么敏感,所以数据的传输曲线类似这样

拥塞控制是tcp为了尽快让数据安全的到达同时尽可能快的发送,但又要避免数据量过大而是网络的压力过大而导致大量丢包的折中方案

延时应答

每次收到了数据包都返回一个ack的话,对网络带宽也是不小的使用,而这数据包也并没有传输什么实际的内容,为了减少这样的消耗,tcp引入了延时应答机制

1. 在收到一定数量的数据包后才返回一个ack,因为确认序号可以包含前面的数据包

2. 在一定的时间之后才返回一个ack

在实际情况中俩种都有在用,在数据量大的时候会用1,而数据量少用2

这样就减少了ack的发送次数,也能增大数据的吞吐量,提高发送的速度

捎带应答

因为引入了延时应答机制,可使得在接收方返回发送发的请求时,也顺带将ack一起发送了,这以能减少带宽的消耗,和封装分用的次数

面向字节流

面向字节流的好处是将数据变为了一个个连续的字节,发送方可以根据当时网络的情况和数据的大小来灵活的处理发送的大小,而数据报不行,他最小都是65535这么大,在接收的是后,根据序号将数据排列好就能被读走,要发送的数据放在缓冲区中等待,如果要发送的数据太少了,那么就可以在缓冲区中先等一会,等把数据积累到了一定量后才发送出去

全双工

创建了Socket对象同时也会在内核创建一个对应的发送缓冲区和接受缓冲区,通过read和write在读走和写入数据,因为这俩个缓冲区的存在,使得了在这个连接中数据的写入和读取可以同时进行,而且单位也不用匹配,可以一次读一个字节的同时写入100个字节

粘包问题

这里要明确粘的包其实是应用层的包,而在这上面所说的都是在传输层的数据包,在传输层的角度上来看,数据是按顺序排列好放在传输的层的缓冲区中,但是在把tcp报头去掉之后放到引用层对应的缓冲区中的之后,包于包之间的简介就分不开了,

因为应用层并不知道这个数据包有多大,储存了这个包大小的tcp报头已经被去掉了,剩下的传递给应用层的都是发送端发送的真正的有用的数据

在应用层的角度上看到的就是一连串的数据,他并不知道要从哪里开始读,读到哪里才是一个数据包的结尾,这种问题在tcp的角度上是解决不了的,tcp在怎么厉害也不可能干涉到应用层的事情,也不可能更改接受到数据包的,那么这就需要我们在应用层的角度来解决这个问题

我们可以在应用层的协议来设置包的结尾,

1. 用空的一行来表示这是数据包的结尾,或者是用特殊符号来表示这是数据包的结尾

2. 定义每个数据包的前4个字节用来表示这个数据包的大小,这样在读取时就可以知道数据包的大小了

这俩种方法在http中都有使用,比如发起get请求的话会使用空行来表示数据的结尾

而post请求会有个Content-Length字段来表示数据包的大小

异常崩溃的处理

不管是程序的正常退出还是会崩溃退出,都会走完四次挥手的正常流程

如果是在服务器发送的FIN还没有被接收方接收到,就关闭了连接了,那么服务器在多次发送FIN之后还没有收到返回的ack的话,那么就认为对端出现异常,并将连接异常终止,把储存对端的信息也给删除

在数据传输的时候,如果接收方突然掉线了的话,那么发送方就收不到返回的ack并会触发重传机制,在重传到一定次数之后,发现还没有ack返回,这是会发送一个RST复位报文段,表示重置这个连接,如果这是有了ack的返回,那么就会重新发送数据,而如果还没有ack的返回,那么就会断开连接

如果是发送方突然掉线了的话,接收方突然发现就没有声音,在等待一段时间后,会发送一个特殊的报文,这个报文不携带任何信息,只是为了触发ack,如果还没有消息的话,就会单方面的释放这个连接,如果这个报文是周期性的发送的话,那又称为心跳包

在分布式系统中,有个入口服务器,他连接了几个功能相同的服务器,他的作用是负责将接收到了请求合理的分配到和他连接的几个服务器去,在工作的途中,如果有服务器挂了,那么入口服务器需要再秒级的时间内知道,并报出错误和切断和这个服务器的连接,将这后来的请求再分布在正常的服务器中,而为了能在秒级的时间内知道,就需要入口服务器周期的发送心跳包来获得服务器的状态

TCP协议能够被广泛使用是有原因的,他为了能让数据可靠的到达对方的同时尽可能快的发送出去,而为了实现这一操作,tcp做出了许多的机制

确保可靠性的机制

检验和:确保数据包没有被更改过

序列号:确保数据以正确顺序被读入

确认应答:知道数据是否被收到

连接管理:三次握手和四次挥手,在确保连接的安全建立和断开

超时重传:对没有收到对应ack的数据进行重传

流量控制:通过改变窗口的大小来影响数据发送的速率,以避免传输数率过大而导致丢包严重

加快传输速率的机制

滑动窗口:让数据能不等待的发送出去

延时应答:减少ack的发送频率,增大数据的吞吐量

捎带应答:减少ack的发送频率,还能减少封装和分用的次数

快速重传:对丢失的数据进行单独重传

TCP使用了许多机制来确保了可靠传输的同时发送速率不会低下,这才有了TCP现在的大获成功,也能看的出,成功不是一蹴而就的,是在不断的积累中才能破茧而出(突发奇想哈 嘻嘻),别着急慢慢来,船到桥头自然直(这段也是)

END~~~

;