第六章:应用层
6.1 网络应用模型
1、应用层概述
应用层对应用程序的通信提供服务。
应用层协议定义:应用进程交换的报文类型,请求还是相应;各种报文类型的语法,如报文中的各个字段及其详细描述;字段的语义,即包含在字段中的信息的含义;进程何时、如何发送报文,以及对报文进行相应的规则。
应用层的功能:文件传输、访问和管理;电子邮件;虚拟终端;查询服务和远程作业登录
应用层的重要协议:FTP、SMTP、POP3、HTTP、DNS
2、网络应用模型
1)客户/服务器(C/S)模型(Client/Server)
服务器(提供计算服务的设备):永久提供服务;永久性访问地址/域名。
客户机(请求计算服务的主机):与服务器通信,使用服务器提供的服务;间歇性接入网络;可能使用动态IP地址;不与其他客户机直接通信
应用:Web、文件传输FTP、远程登录、电子邮件
2)P2P模型(Peer-to-Peer)
不存在永远在线的服务器;每个主机既可以提供服务,也可以请求服务;任意端系统/节点之间可以直接通讯;节点间歇性接入网络;节点可能改变IP地址;可扩展性好;网络健壮性强。
6.2 DNS系统(域名解析系统)
DNS就是将域名解析为IP地址
1、域名
域名就是类似于www.xxx.com,.com之后还可以有东西,称之为根。域名从左向右,级别逐渐增高。
2、域名服务器层次结构:
DNS服务器有很多台,根据层次结构分为三层,根域名服务器,顶级域名服务器,权限域名服务器。本地域名服务器不算层次结构,特点是离主机比较近,当主机和另一台比较近的主机通信时,就不用走那些更高级的服务器了。根域名服务器并不是一个域名只有一台,而是一个域名对应多台域名服务器,全世界一共有13个这样的域名,分别是a.rootservers.net,b.rootservers.net,c.rootservers.net,~m.rootservers.net 在权限域名服务器中,虽然看似abc.com比y.abc.com少了一位,但是他们的地位仍是对等的,对应的两台权限域名服务器。
3、域名解析过程:
1)递归查询:主机先是想本地域名服务器发送请求,如果查不到的话,本地域名服务器向根域名服务器发送请求(找别人),如果还是查不到的话,根域名域名服务器向顶级域名服务器发送请求(找别人),如果还是查不到的话,顶级域名服务器向权限域名服务器发送请求(找别人)。可以看到每一次向下一个查询的服务器都变了,不是主机一个个去问,而是服务器自己一个个问下去
2)迭代查询:主机先是想本地域名服务器发送请求,如果查不到的话,本地域名服务器就让主机去向根域名服务器发送请求(主机去找,本地域名给目标根域名服务器的IP地址),如果还是查不到的话,根域名域名服务器让主机去向对应的顶级域名服务器发送请求(主机去找,根域名给目标顶级域名服务器的IP地址),如果还是查不到的话,顶级域名服务器让主机去向权限域名服务器发送请求(主机去找,顶级域名给目标权限域名服务器的IP地址)。可以看到这里是主机一个个挨个问的地址。
高速缓存:为了减少多次查询同一个域名的资源浪费,本地域名服务器会存储最近使用的ip地址解析,下次再访问同一个域名就不需要这么多查询步骤了。同时这个高速缓存主机本身也有存储。同时本地域名服务器还可以对顶级域名服务器,权限域名服务器的地址进行缓存,下一次即使是不知道的ip地址,查询也可以更快。高速缓存为了保持正确性,需要定时更新。
6.3 文件传输协议FTP
文件传送协议FTP(file transfer protocol):提供不同种类主机系统(硬、软件体系等都可以不同)之间的文件传输能力。
简单文件传送协议TFTP(trivial file transfer protocol):是一个轻量的,比较容易实现的,面对小文件的,UDP的文件传输协议。
拷贝(上传/下载)
1、FTP服务器和用户端
FTP是基于客户/服务器(C/S)的协议。用户通过一个客户机程序连接至在远程计算机上运行的服务器程序。依照FTP协议提供服务,进行文件传送的计算机就是FTP服务器。连接FTP服务器,遵循FTP协议与服务器传送文件的电脑就是FTP客户端。
2、FTP工作原理
为什么有匿名登陆:对于一些公共服务器来说,增加验证阶段就是增加资源开销,减少验证阶段就可以节省资源来更好地服务
主进程和从属进程的区别:主进程是打开端口,让外部发送的数据可以进来,并且将这些数据逐个分配各从属进程。从属进程则是单独为这些数据服务
这里的主进程被忽略,没标在上图
客户端和服务器端先建立TCP连接,端口是21,称为控制连接
然后看情况是主动建立连接还是被动建立连接
主动建立连接是指服务器端主动发送请求和客户端进行连接,此时端口号固定是20
被动连接是指客户端发送请求和服务器端建立数据传送连接,此时端口号不确定,由两者协商得到
数据传输完成之后,数据连接断开,控制连接继续保持,直至两边发送断开请求
3、FTP传输模式:
文本模式:ASCII模式,以文本序列传输数据
二进制模式:Binary模式,以二进制序列传输数据
6.4 电子邮件
1、电子邮件的信息格式
2、组成结构
用户代理:
撰写就是给用户编辑信件的环境
显示就是可以看到自己写的和自己收的信件内容
处理就是对信件进行操作,包括删除,打印,转发等等
通信就是可以将邮件发送到邮件服务器当中,同时可以从邮件服务器当中读取邮件
邮件服务器:
邮件服务器端的发送和接受是指从自己的用户代理处接收邮件,之后向对面的邮件服务器发送邮件
邮件服务器的报告邮件发送结果就是投递是否成功这种情况
邮件服务器既可以作为客户端又可以作为服务器端,使用的是C/S方式
协议:
发邮件用的是SMTP
收邮件的是POP3或者IMAP
3、简单邮件传送协议SMTP
SMTP规定了在两个相互通信的SMTP进程之间应如何交换信息。负责接收邮件的进程就是SMTP服务器。SMTP规定了14条命令(几个字母)和21种应答信息(三位数字代码+简单文字说明)
TCP连接 端口号25 C/S
SMTP通信三个阶段:连接建立---->邮件传送---->连接释放
RCPT能有多条命令的原因是,电子邮件可以有多个收件人,就是群发,所以允许多个RCPT
这里服务器和客户端可以互换,视具体情况而定,发送方是客户端,接收方是服务器端
4、MIME协议(改进SMTP缺点)
SMTP的缺点:不能传送可执行文件或者其他二进制对象;仅限于传送7位ASCII码,不能传送其他非英语国家的文字;服务器会拒绝超过一定长度的邮件。
MIME改善SMTP发送数据的缺点,是SMTP的功能性扩展。MIME协议已经逐渐开始应用到浏览器当中,通过对不同文件类型用不同的标识符标识,来让浏览器读取通过MIME的相关文件。
5、邮局协议POP3
TCP连接 端口号110 C/S
POP3工作方式:下载并保留(在服务器)、下载并删除
6、网际报文存取协议IMAP
IMAP协议比POP协议复杂。当用户PC上的IMAP客户程序打开IMAP服务器的邮箱时,用户可以看到邮箱的首部,若用户需要打开某个邮件,该邮件才上传到用户的计算机上。
IMAP可以让用户在不同的地方使用不同的计算机随时上网阅读处理邮件,还允许只读取邮件中的某一个部分(先看正文,有WiFi的时候再下载附件)
7、基于万维网的电子邮件
基于万维网的电子邮件的邮件服务器端可以不同。同时,发送邮件使用的SMTP/MIME和收邮件时的POP3/IMAP协议都换成了HTTP协议。方便
6.5 万维网和HTTP协议
1、万维网概述
URL用来标识整个互联网当中的某一个资源(文字,视屏,音频等)的位置
HTTP用来将这些资源传送给用户
HTML帮助设计者来设计页面,让不同设计者设计的页面都可以在界面上显示
2、超文本传输协议HTTP
HTTP协议定义了浏览器(万维网客户进程)怎样向万维网服务器请求万维网文档,以及服务器怎样把文档传送给浏览器。
服务器通过TCP 80端口来监听HTTP请求
HTTP可以不一次性下载完页面的所有资源,可以只下载文本部分,其他音频视频等待用户下一步请求之后再传输
3、HTTP协议的特点
4、HTTP的连接方式
非持久连接:在TCP三次握手的第三次握手时发生,将HTTP请求作为第三次握手的数据部分发给服务器,服务器收到请求之后将HTTP相应报文传输给客户。耗时就是RTT*2+文档传输时间。
缺点就是这样如果再想传输,那么就需要重新建立TCP连接从头开始。
持久连接:和非持久连接类似,都是在第三次握手时发生,将HTTP请求作为第三次握手的数据部分发给服务器,服务器收到请求之后将HTTP相应报文传输给客户。但是持久连接再需要请资源的时候就不需要建立新的TCP连接了。
非流水线就是发一个,确认一个,才能再发下一个;流水线就是一个个连着发,然后多个确认
5、报文结构
HTTP报文分为请求报文和相应报文。
HTTP报文是面向文本的,因此在报文中的每一个字段都是一些ASCII码串。
开始行用于区别请求报文和响应报文。请求报文的方法是指命令,就是对所请求的对象进行什么操作,如获取/删除等。URL就是之间说的资源标识符。版本是指使用的是什么版本的HTTP协议。CRLF相当于我们程序里面的;,标识一行的结束。同时,在整个首部行结束时,为了区别首部行和实体主体还会有一行单独的CRLF 。
例子:
6.6 总结
参考资料:王道考研