Bootstrap

数据链路层——MAC帧、ARP协议详解

用于同一链路中的两个节点之间的数据传输。

以太网MAC帧

MAC帧格式

目的地址和源地址是指网卡的硬件地址,也叫MAC地址,长度是48位,是在网卡出厂时固定的;

● 帧协议类型字段有三种值,分别对应IP、ARP、RARP;

● 帧末尾是CRC校验码

如何分离

由于以太网帧的首部与末尾的字段都是定长的,可以直接拿到以太网帧中的数据。

如何交付

根据报头中 类型 字段,将有效载荷交付给上层对应的协议。

局域网通信原理

● 我们知道了局域网中某一节点的IP地址,但我们并不能直接向该节点发送数据。因为链路上的识别是依靠MAC地址来实现的。如果MAC地址不符合,则会被直接丢弃;

● MAC地址是用来识别数据链路层中相连的节点,在网卡出厂时就确定了,不能修改,MAC地址通常是唯一的(也有些网卡支持用户配置MAC地址);

● 我们首先需要向该局域网中发送包含目的IP地址和本地MAC地址的广播,这个广播会被局域网中所有节点收到;

● 收到广播的节点会根据IP地址是否相符,从而向我们的MAC地址发送一段包含它的MAC地址的数据包;(通过ARP协议实现)

● 当我们收到目的节点的MAC地址,便能向该节点直接发送数据了;

MTU

● 以太网帧中的数据长度规定最小是46字节,最大1500字节,ARP数据包的长度不够46字节,要在后面补上填充位;

● 最大值1500称为以太网的最大传输单元,也就是MTU,不同的网络类型有不同的MTU;

● 如果一个数据包从以太网路由到拨号链路上,数据包长度大于拨号链路的MTU了,则需要对数据包进行分片;

● 不同的数据链路层标准的MTU是不同的;

MTU对UDP的影响

对于UDP协议而言,这个协议本身是无连接的,对数据包的到达顺序以及是否正确到达不关心,所以一般UDP应用对分片没有特殊要求。

● 一旦UDP携带的数据超过1472(1500 - 20(IP首部) - 8(UDO首部)),那么就会在网络层分成多个IP数据报;

● 这多个IP数据报有任意一个丢失,都会引起接收端网络层重组失败。那么这就意味着,如果UDP数据报在网络层被分片,整个数据被丢失的概率就大大增加了。

MTU对TCP的影响

对于TCP协议而言就不一样了,这个协议是面向连接的,TCP协议非常在意数据包到达的顺序以及是否在传输中有错误发生。所以有些TCP应用对分片有要求,会设置不能分片标志位。

● 不过通常而言,TCP数据报是不需要进行分片的;

● TCP在建立连接的过程中,通信双方会进行MSS协商;

● MSS是TCP单个数据报的最大长度;

● 双方在发送SYN的时候会在TCP头部写入自己能支持的MSS值;

● 然后双方得知对方的MSS值之后,选择较小的作为最终MSS;

● MSS的值就是在TCP首部的40字节变长选项中;

● 而MSS的值受限与MTU,最理想的情况下,MSS的值正好是在IP不会分片处理的最大长度;

MTU和MSS的关系

ARP协议

ARP协议工作在数据链路层,但ARP不是一个单纯的数据链路层的协议,而是作为MAC层的上层,位于网络层和MAC层之间。

 ARP协议格式

注意到源MAC地址、目的MAC地址在以太网首部和ARP请求中个出现了一次,对于链路层为以太网的情况是多余的,但如果链路层是其它类型的网络则有可能是必要的。

● 硬件类型指链路层网络类型,1 为以太网;

● 协议类型指要转换的地址类型,0x0800为IP地址;

● 硬件地址长度对于以太网地址为 6 字节;

● 协议地址长度对于IP地址为 4 字节;

● op字段为 1 表示ARP请求,op字段为 2 表示ARP应答;

ARP协议的作用

● ARP协议建立了主机 IP地址 和 MAC地址 的映射关系;

● 网络通信时,知道目的主机的IP地址,是不能直接向其发送数据的;

● 我们需要通过目的主机的IP地址,来获取目的主机的硬件地址;

ARP协议的工作流程

● 源主机发出ARP请求,询问目的IP地址对应主机的硬件地址是多少,并将这个请求广播到本地网段(以太网帧首部的硬件地址填 FF:FF:FF:FF:FF:FF 表示广播);

● 目的主机接收到广播的ARP请求,发现其中的IP地址与本机相符,则发送一个ARP应答数据包给源主机,将自己的硬件地址填写在应答包中;

● 每台主机都维护一个ARP缓存表,可以用arp -a命令查看。缓存表中的表项有过期时间(一般是20分组),如果20分钟内没有再次使用某个表项,则该表项失效,下次还要发ARP请求来获得目的主机的硬件地址;

 

为什么要有缓存表?

缓存表记录了本主机在本地网段的历史通信记录,对于本地需要进行频繁的通信而言(例如本地主机通过路由器,频繁地访问外网),维护一张缓存表能够使我们快速获取目的IP主机的硬件地址,而不是每次通过发送ARP请求广播的方式获取。从而提高了局域网通信的效率。

为什么表项要有过期时间而不是一直有效?

缓存表中的每一个表项都是以某种数据结构的形式组织起来,通过操作系统来维护的。而缓存表的大小是有限的,若将本地主机与本地网段的所有通信历史记录都永久保存,缓存表的空间就会不断减少,导致需要被缓存的表项而无法缓存;另外,一台主机可能会出现在不同的网段,若永久保留之前网段的缓存数据,这些数据很可能是将来用不上的。所以对于一段时间未使用的缓存表项,需要被清理。

悦读

道可道,非常道;名可名,非常名。 无名,天地之始,有名,万物之母。 故常无欲,以观其妙,常有欲,以观其徼。 此两者,同出而异名,同谓之玄,玄之又玄,众妙之门。

;