浏览器输入某URL后,HTTP开启了一段奇妙之旅!

时间:2022-07-24
本文章向大家介绍浏览器输入某URL后,HTTP开启了一段奇妙之旅!,主要内容包括其使用实例、应用技巧、基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下。
当用户在浏览器输入网址回车之后,网络协议都做了哪些工作呢?

1. 首先干活的是 浏览器应用程序,他要解析出 URL中的域名

2. 根据域名获取对应的ip地址,首先从浏览器缓存中查看,如下可以查看浏览器中域名对应ip的解析

chrome://net‐internals/#events

如果没有则从本机域名解析文件hosts(/etc/hosts)中查看,还没有则从LDNS(Localdnsserver)、Rootserver域名服务器、国际顶级域名服务商的DNS 的层层解析

3. 拿到IP地址后,浏览器就可以发起 与服务器的三次握手

4. 握手建立之后,就开始组装http请求报文,发送报文

5. 服务器收到请求报文之后开始,请求报文解析,生成响应数据,发送响应数据

6. 浏览器收到响应之后,开始渲染页面

让我们聊一聊HTTP协议

超文本传输协议(HyperText Transfer Protocol,HTTP):一种无状态的,以请求/应答方式运行的协议,它使用可扩展的语义和自描述消息格式,与 基于网络的超文本信息系统灵活的互动

1.HTTP报文格式

HTTP 协议的请求报文和响应报文的结构基本相同,由三大部分组成:

  • 起始行(start line):描述请求或响应的基本信息
  • 头部字段集合(header):使用 key-value 形式更详细地说明报文
  • 消息正文(entity):实际传输的数据,它不一定是纯文本,可以是图片、视频等二进制数据

2.请求行报文格式

以下是wireshark抓出来的一段HTTP请求报文:

GET /admin_ui/rdx/core/images/close.png HTTP/1.1
Accept: */*
Referer: http://xxx.xxx.xxx.xxx/menu/neo
Accept-Language: en-US
User-Agent: Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 6.1; WOW64; Trident/7.0; SLCC2; .NET CLR 2.0.50727; .NET CLR 3.5.30729; .NET CLR 3.0.30729; .NET4.0C; .NET4.0E)
Accept-Encoding: gzip, deflate
Host: xxx.xxx.xxx.xxx
Connection: Keep-Alive
Cookie: startupapp=neo; is_cisco_platform=0; rdx_pagination_size=250%20Per%20Page; SESSID=deb31b8eb9ca68a514cf55777744e339
  • 请求方法:如 GET/HEAD/PUT/POST,表示对资源的操作;
  • 请求目标:通常是一个 URI,标记了请求方法要操作的资源;
  • 版本号:表示报文使用的 HTTP 协议版本。

3.响应行报文格式

下面是wireshark抓出来的一段响应报文:

HTTP/1.1 200 OK
Bdpagetype: 1
Bdqid: 0xacbbb9d800005133
Cache-Control: private
Connection: Keep-Alive
Content-Encoding: gzip
Content-Type: text/html
Cxy_all: baidu+f8b5e5b521b3644ef7f3455ea441c5d0
Date: Fri, 12 Oct 2018 06:36:28 GMT
Expires: Fri, 12 Oct 2018 06:36:26 GMT
Server: BWS/1.1
Set-Cookie: delPer=0; path=/; domain=.baidu.com
Set-Cookie: BDSVRTM=0; path=/
Set-Cookie: BD_HOME=0; path=/
Set-Cookie: H_PS_PSSID=1433_21112_18560_26350_27245_22158; path=/; domain=.baidu.com
Vary: Accept-Encoding
X-Ua-Compatible: IE=Edge,chrome=1
Transfer-Encoding: chunked
 
<!DOCTYPE html>
<!--STATUS OK-->
  • 版本号:表示报文使用的 HTTP 协议版本;
  • 状态码:一个三位数,用代码的形式表示处理的结果,比如 200 是成功,500是服务器错误;
  • 原因:作为数字状态码补充,是更详细的解释文字,帮助人理解原因

4.HTTP 头字段

头部字段是 key-value 的形式,key 和 value 之间用“:”分隔,最后用 CRLF 换行表示字段结束。

比如前后分离时经常遇到的要与后端协商传输数据的类型“Content-type:application/json”,这里 key 就是“Content-type”,value 就是“application/json”。HTTP 头字段非常灵活,不仅可以使用标准里的 HostConnection 等已有头,也可以任意添加自定义头,这给 HTTP 协议带来了无限的扩展可能。

头字段注意事项
  • 字段名不区分大小写,字段名里不允许出现空格,可以使用连字符“-”,但不能使用下划线“”(有的服务器不会解析带“”的头字段)。字段名后面必须紧接着“:”,不能有空格,而“:”后的字段值前可以有多个空格;
  • 字段的顺序是没有意义的,可以任意排列不影响语义;
  • 字段原则上不能重复,除非这个字段本身的语义允许,例如 Set-Cookie

5.常用头字段

HTTP 协议中有非常多的头字段,但基本上可以分为三大类:

  • 请求字段:请求头中的头字段;如HostReferer
  • 响应字段:响应头中的头字段,如:Server
  • 通用字段:在请求头和响应头里都可以出现,如 Content-typeConnection