# 1.4.2 HTTP 协议基础 - [什么是 HTTP](#什么是-http) - [HTTP 请求与响应](#http-请求与响应) - [HTTP 方法](#http-方法) - [URL](#url) - [HTTP 消息头](#http-消息头) - [Cookie](#cookie) - [状态码](#状态码) - [HTTPS](#https) ## 什么是 HTTP HTTP 是 Web 领域的核心通信协议。最初的 HTTP 支持基于文本的静态资源获取,随着协议版本的不断迭代,它已经支持如今常见的复杂分布式应用程序。 HTTP 使用一种基于消息的模型,建立于 TCP 层之上。由客户端发送一条请求消息,而后由服务器返回一条响应消息。 ## HTTP 请求与响应 一次完整的请求或响应由消息头、一个空白行和消息主体构成。以下是一个典型的 HTTP 请求: ``` GET / HTTP/1.1 Host: www.github.com User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:52.0) Gecko/20100101 Firefox/52.0 Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8 Accept-Language: zh-CN,zh;q=0.8,en-US;q=0.5,en;q=0.3 Accept-Encoding: gzip, deflate Upgrade-Insecure-Requests: 1 Cookie: logged_in=yes; Connection: close ``` 第一行分别是请求方法,请求的资源路径和使用的 HTTP 协议版本 第二至九行为消息头键值对 以下是对上面请求的回应(并不一定和真实访问相同,这里只是做为示例) ``` HTTP/1.1 200 OK Date: Tue, 26 Dec 2017 02:28:53 GMT Content-Type: text/html; charset=utf-8 Connection: close Server: GitHub.com Status: 200 OK Cache-Control: no-cache Vary: X-PJAX X-UA-Compatible: IE=Edge,chrome=1 Set-Cookie: user_session=37Q; path=/; X-Request-Id: e341 X-Runtime: 0.538664 Content-Security-Policy: default-src 'none'; Strict-Transport-Security: max-age=31536000; includeSubdomains; preload Public-Key-Pins: max-age=0; X-Content-Type-Options: nosniff X-Frame-Options: deny X-XSS-Protection: 1; mode=block X-Runtime-rack: 0.547600 Vary: Accept-Encoding X-GitHub-Request-Id: 7400 Content-Length: 128504 ...... ``` 第一行为协议版本、状态号和对应状态的信息 第二至二十二为返回头键值对 紧接着为一个空行和返回的内容实体。 ## HTTP 方法 在提到HTTP方法之前,我们需要先讨论一下 HTTP 版本问题。HTTP 协议现在共有三个大版本,版本差异会导致一些潜在的漏洞利用方式。 |版本 |简述 | |-------|-------| |HTTP 0.9|该版本只允许 GET 方法,具有典型的无状态性,无协议头和状态码,支持纯文本| |HTTP 1.0|增加了 HEAD 和 POST 方法,支持长连接、缓存和身份认证| |HTTP 1.1|增加了 Keep-alive 机制和 PipeLining 流水线,新增了 OPTIONS、PUT、DELETE、TRACE、CONNECT 方法| |HTTP 2.0|增加了多路复用、头部压缩、随时复位等功能| |请求方法 |描述 | |------- |------- | |GET |请求获取 URL 资源 | |POST |执行操作,请求 URL 资源后附加新的数据| |HEAD |只获取资源响应消息报头| |PUT |请求服务器存储一个资源| |DELETE |请求服务器删除资源| |TRACE |请求服务器回送收到的信息| |OPTIONS |查询服务器的支持选项| ## URL URL 是统一资源定位符,它代表了 Web 资源的唯一标识,如同电脑上的盘符路径。最常见的 URL 格式如下所示: ``` protocol://[user[:password]@]hostname[:post]/[path]/file[?param=value] 协议 分隔符 用户信息 域名 端口 路径 资源文件 参数键 参数值 ``` 下面是一张具体案例分析 ![](../pic/1.4.2_http_url.png) ## HTTP 消息头 HTTP 支持许多不同的消息头,一些有着特殊作用,而另一些则特定出现在请求或者响应中。 |消息头 |描述 |备注 | |------- |------- |-----------| |Connection |告知通信另一端,在完成HTTP传输后是关闭 TCP 连接,还是保持连接开放 | | |Content-Encoding|规定消息主体内容的编码形式 | | |Content-Length|规定消息主体的字节长度 | | |Content-Type|规定消息主体的内容类型 | | |Accept|告知服务器客户端愿意接受的内容类型 |请求 | |Accept-Encoding|告知服务器客户端愿意接受的内容编码 |请求 | |Authorization|进行内置 HTTP 身份验证 |请求 | |Cookie |用于向服务器提交 cookie |请求 | |Host |指定所请求的完整 URL 中的主机名称 |请求 | |Oringin |跨域请求中的请求域 |请求 | |Referer |指定提出当前请求的原始 URL |请求 | |User-Agent |提供浏览器或者客户端软件的有关信息 |请求 | |Cache-Control|向浏览器发送缓存指令 |响应 | |Location |重定向响应 |响应 | |Server |提供所使用的服务器软件信息 |响应 | |Set-Cookie |向浏览器发布 cookie |响应 | |WWW-Authenticate|提供服务器支持的验证信息 |响应 | ## Cookie Cookie 是大多数 Web 应用程序所依赖的关键组成部分,它用来弥补 HTTP 的无状态记录的缺陷。服务器使用 Set-Cookie 发布 cookie,浏览器获取 cookie 后每次请求会在 Cookie 字段中包含 cookie 值。 Cookie 是一组键值对,另外还包括以下信息: - expires,用于设定 cookie 的有效时间。 - domain,用于指定 cookie 的有效域。 - path,用于指定 cookie 的有效 URL 路径。 - secure,指定仅在 HTTPS 中提交 cookie。 - HttpOnly,指定无法通过客户端 JavaScript 直接访问 cookie。 ## 状态码 状态码表明资源的请求结果状态,由三位十进制数组成,第一位代表基本的类别: - 1xx,提供信息 - 2xx,请求成功提交 - 3xx,客户端重定向其他资源 - 4xx,请求包含错误 - 5xx,服务端执行遇到错误 常见的状态码及短语如下所示: |状态码|短语|描述| |-----|----|----| |100|Continue |服务端已收到请求并要求客户端继续发送主体| |200|Ok |已成功提交,且响应主体中包含请求结果 | |201|Created |PUT请求方法的返回状态,请求成功提交 | |301|Moved Permanently|请求永久重定向 | |302|Found |暂时重定向 | |304|Not Modified|指示浏览器使用缓存中的资源副本 | |400|Bad Request|客户端提交请求无效 | |401|Unauthorized|服务端要求身份验证 | |403|Forbidden |禁止访问被请求资源 | |404|Not Found |所请求的资源不存在 | |405|Method Not Allowed|请求方法不支持 | |413|Request Entity Too Large|请求主体过长 | |414|Request URI Too Long|请求URL过长 | |500|Internal Server Error|服务器执行请求时遇到错误 | |503|Service Unavailable|Web服务器正常,但请求无法被响应| 401 状态支持的 HTTP 身份认证 - Basic,以 Base64 编码的方式发送证书 - NTLM,一种质询-响应机制 - Digest,一种质询-响应机制,随同证书一起使用一个随机的 MD5 校验和 ## HTTPS HTTPS 用来弥补 HTTP 明文传输的缺陷。通过使用安全套接字 SSL,在端与端之间传输加密后的消息,保护传输数据的隐密性和完整性,并且原始的 HTTP 协议依然按照之前同样的方式运作,不需要改变。 ## 参考资料 [URL](https://en.wikipedia.org/wiki/URL) [HTTP 协议版本对比](https://www.cnblogs.com/andashu/p/6441271.html) 《黑客攻防技术宝典——Web 实战篇》