2017-12-26 15:15:13 +07:00
|
|
|
|
# 1.4.2 HTTP 协议基础
|
|
|
|
|
|
|
|
|
|
- [什么是 HTTP](#什么是-http)
|
|
|
|
|
- [HTTP 请求与响应](#http-请求与响应)
|
|
|
|
|
- [HTTP 方法](#http-方法)
|
|
|
|
|
- [URL](#url)
|
|
|
|
|
- [HTTP 消息头](#http-消息头)
|
|
|
|
|
- [Cookie](#cookie)
|
|
|
|
|
- [状态码](#状态码)
|
|
|
|
|
- [HTTPS](#https)
|
2018-02-21 15:38:41 +07:00
|
|
|
|
- [参考资料](#参考资料)
|
|
|
|
|
|
2017-12-26 15:15:13 +07:00
|
|
|
|
## 什么是 HTTP
|
2018-08-05 16:43:10 +07:00
|
|
|
|
|
2017-12-26 15:15:13 +07:00
|
|
|
|
HTTP 是 Web 领域的核心通信协议。最初的 HTTP 支持基于文本的静态资源获取,随着协议版本的不断迭代,它已经支持如今常见的复杂分布式应用程序。
|
|
|
|
|
|
|
|
|
|
HTTP 使用一种基于消息的模型,建立于 TCP 层之上。由客户端发送一条请求消息,而后由服务器返回一条响应消息。
|
|
|
|
|
|
2018-02-21 15:38:41 +07:00
|
|
|
|
## HTTP 请求与响应
|
2018-08-05 16:43:10 +07:00
|
|
|
|
|
2017-12-26 15:15:13 +07:00
|
|
|
|
一次完整的请求或响应由消息头、一个空白行和消息主体构成。以下是一个典型的 HTTP 请求:
|
2018-08-05 16:43:10 +07:00
|
|
|
|
|
2018-02-21 15:38:41 +07:00
|
|
|
|
```http
|
2017-12-26 15:15:13 +07:00
|
|
|
|
GET / HTTP/1.1
|
|
|
|
|
Host: www.github.com
|
|
|
|
|
User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:52.0) Gecko/20100101 Firefox/52.0
|
|
|
|
|
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8
|
|
|
|
|
Accept-Language: zh-CN,zh;q=0.8,en-US;q=0.5,en;q=0.3
|
|
|
|
|
Accept-Encoding: gzip, deflate
|
|
|
|
|
Upgrade-Insecure-Requests: 1
|
|
|
|
|
Cookie: logged_in=yes;
|
|
|
|
|
Connection: close
|
|
|
|
|
```
|
2018-08-05 16:43:10 +07:00
|
|
|
|
|
2018-02-21 15:38:41 +07:00
|
|
|
|
第一行分别是请求方法,请求的资源路径和使用的 HTTP 协议版本,第二至九行为消息头键值对。
|
2017-12-26 15:15:13 +07:00
|
|
|
|
|
2018-02-21 15:38:41 +07:00
|
|
|
|
以下是对上面请求的回应(并不一定和真实访问相同,这里只是做为示例):
|
2018-08-05 16:43:10 +07:00
|
|
|
|
|
2018-02-21 15:38:41 +07:00
|
|
|
|
```http
|
2017-12-26 15:15:13 +07:00
|
|
|
|
HTTP/1.1 200 OK
|
|
|
|
|
Date: Tue, 26 Dec 2017 02:28:53 GMT
|
|
|
|
|
Content-Type: text/html; charset=utf-8
|
|
|
|
|
Connection: close
|
|
|
|
|
Server: GitHub.com
|
|
|
|
|
Status: 200 OK
|
|
|
|
|
Cache-Control: no-cache
|
|
|
|
|
Vary: X-PJAX
|
|
|
|
|
X-UA-Compatible: IE=Edge,chrome=1
|
|
|
|
|
Set-Cookie: user_session=37Q; path=/;
|
|
|
|
|
X-Request-Id: e341
|
|
|
|
|
X-Runtime: 0.538664
|
2018-08-05 16:43:10 +07:00
|
|
|
|
Content-Security-Policy: default-src 'none';
|
2017-12-26 15:15:13 +07:00
|
|
|
|
Strict-Transport-Security: max-age=31536000; includeSubdomains; preload
|
|
|
|
|
Public-Key-Pins: max-age=0;
|
|
|
|
|
X-Content-Type-Options: nosniff
|
|
|
|
|
X-Frame-Options: deny
|
|
|
|
|
X-XSS-Protection: 1; mode=block
|
|
|
|
|
X-Runtime-rack: 0.547600
|
|
|
|
|
Vary: Accept-Encoding
|
|
|
|
|
X-GitHub-Request-Id: 7400
|
|
|
|
|
Content-Length: 128504
|
|
|
|
|
|
|
|
|
|
<!DOCTYPE html>
|
|
|
|
|
......
|
|
|
|
|
```
|
|
|
|
|
|
2018-08-05 16:43:10 +07:00
|
|
|
|
第一行为协议版本、状态号和对应状态的信息,第二至二十二为返回头键值对,紧接着为一个空行和返回的内容实体。
|
2017-12-26 15:15:13 +07:00
|
|
|
|
|
|
|
|
|
## HTTP 方法
|
|
|
|
|
|
2018-08-05 16:43:10 +07:00
|
|
|
|
在提到 HTTP 方法之前,我们需要先讨论一下 HTTP 版本问题。HTTP 协议现在共有三个大版本,版本差异会导致一些潜在的漏洞利用方式。
|
2017-12-26 15:15:13 +07:00
|
|
|
|
|
2018-08-05 16:43:10 +07:00
|
|
|
|
| 版本 | 简述 |
|
|
|
|
|
| --- | --- |
|
|
|
|
|
| HTTP 0.9 | 该版本只允许 GET 方法,具有典型的无状态性,无协议头和状态码,支持纯文本 |
|
|
|
|
|
| HTTP 1.0 | 增加了 HEAD 和 POST 方法,支持长连接、缓存和身份认证 |
|
|
|
|
|
| HTTP 1.1 | 增加了 Keep-alive 机制和 PipeLining 流水线,新增了 OPTIONS、PUT、DELETE、TRACE、CONNECT 方法 |
|
|
|
|
|
| HTTP 2.0 | 增加了多路复用、头部压缩、随时复位等功能 |
|
|
|
|
|
|
|
|
|
|
| 请求方法 | 描述 |
|
|
|
|
|
| --- | --- |
|
|
|
|
|
| GET | 请求获取 URL 资源 |
|
|
|
|
|
| POST | 执行操作,请求 URL 资源后附加新的数据 |
|
|
|
|
|
| HEAD | 只获取资源响应消息报头 |
|
|
|
|
|
| PUT | 请求服务器存储一个资源 |
|
|
|
|
|
| DELETE | 请求服务器删除资源 |
|
|
|
|
|
| TRACE | 请求服务器回送收到的信息 |
|
|
|
|
|
| OPTIONS | 查询服务器的支持选项 |
|
2017-12-26 15:15:13 +07:00
|
|
|
|
|
|
|
|
|
## URL
|
2018-08-05 16:43:10 +07:00
|
|
|
|
|
2017-12-26 15:15:13 +07:00
|
|
|
|
URL 是统一资源定位符,它代表了 Web 资源的唯一标识,如同电脑上的盘符路径。最常见的 URL 格式如下所示:
|
2018-08-05 16:43:10 +07:00
|
|
|
|
|
|
|
|
|
```text
|
2017-12-26 15:15:13 +07:00
|
|
|
|
protocol://[user[:password]@]hostname[:post]/[path]/file[?param=value]
|
2018-08-05 16:43:10 +07:00
|
|
|
|
协议 分隔符 用户信息 域名 端口 路径 资源文件 参数键 参数值
|
2017-12-26 15:15:13 +07:00
|
|
|
|
```
|
|
|
|
|
|
|
|
|
|
下面是一张具体案例分析
|
|
|
|
|
|
2018-08-05 16:43:10 +07:00
|
|
|
|
![img](../pic/1.4.2_http_url.png)
|
2017-12-26 15:15:13 +07:00
|
|
|
|
|
2018-02-21 15:38:41 +07:00
|
|
|
|
## HTTP 消息头
|
2017-12-26 15:15:13 +07:00
|
|
|
|
|
2018-08-05 16:43:10 +07:00
|
|
|
|
HTTP 支持许多不同的消息头,一些有着特殊作用,而另一些则特定出现在请求或者响应中。
|
2017-12-26 15:15:13 +07:00
|
|
|
|
|
2018-08-05 16:43:10 +07:00
|
|
|
|
| 消息头 | 描述 | 备注 |
|
|
|
|
|
| --- | --- | --- |
|
|
|
|
|
| Connection | 告知通信另一端,在完成HTTP传输后是关闭 TCP 连接,还是保持连接开放 | |
|
|
|
|
|
| Content-Encoding | 规定消息主体内容的编码形式 | |
|
|
|
|
|
| Content-Length | 规定消息主体的字节长度 | |
|
|
|
|
|
| Content-Type | 规定消息主体的内容类型 | |
|
|
|
|
|
| Accept | 告知服务器客户端愿意接受的内容类型 | 请求 |
|
|
|
|
|
| Accept-Encoding | 告知服务器客户端愿意接受的内容编码 | 请求 |
|
|
|
|
|
| Authorization | 进行内置 HTTP 身份验证 | 请求 |
|
|
|
|
|
| Cookie | 用于向服务器提交 cookie | 请求 |
|
|
|
|
|
| Host | 指定所请求的完整 URL 中的主机名称 | 请求 |
|
2020-10-31 16:33:08 +07:00
|
|
|
|
| Origin | 跨域请求中的请求域 | 请求 |
|
2018-08-05 16:43:10 +07:00
|
|
|
|
| Referer | 指定提出当前请求的原始 URL | 请求 |
|
|
|
|
|
| User-Agent | 提供浏览器或者客户端软件的有关信息 | 请求 |
|
|
|
|
|
| Cache-Control | 向浏览器发送缓存指令 | 响应 |
|
|
|
|
|
| Location | 重定向响应 | 响应 |
|
|
|
|
|
| Server | 提供所使用的服务器软件信息 | 响应 |
|
|
|
|
|
| Set-Cookie |向浏览器发布 cookie | 响应 |
|
|
|
|
|
| WWW-Authenticate | 提供服务器支持的验证信息 | 响应 |
|
2017-12-26 15:15:13 +07:00
|
|
|
|
|
2018-02-21 15:38:41 +07:00
|
|
|
|
## Cookie
|
2018-08-05 16:43:10 +07:00
|
|
|
|
|
2017-12-26 15:15:13 +07:00
|
|
|
|
Cookie 是大多数 Web 应用程序所依赖的关键组成部分,它用来弥补 HTTP 的无状态记录的缺陷。服务器使用 Set-Cookie 发布 cookie,浏览器获取 cookie 后每次请求会在 Cookie 字段中包含 cookie 值。
|
|
|
|
|
|
|
|
|
|
Cookie 是一组键值对,另外还包括以下信息:
|
2018-08-05 16:43:10 +07:00
|
|
|
|
|
2017-12-26 15:15:13 +07:00
|
|
|
|
- expires,用于设定 cookie 的有效时间。
|
|
|
|
|
- domain,用于指定 cookie 的有效域。
|
|
|
|
|
- path,用于指定 cookie 的有效 URL 路径。
|
|
|
|
|
- secure,指定仅在 HTTPS 中提交 cookie。
|
|
|
|
|
- HttpOnly,指定无法通过客户端 JavaScript 直接访问 cookie。
|
|
|
|
|
|
2018-02-21 15:38:41 +07:00
|
|
|
|
## 状态码
|
2018-08-05 16:43:10 +07:00
|
|
|
|
|
2017-12-26 15:15:13 +07:00
|
|
|
|
状态码表明资源的请求结果状态,由三位十进制数组成,第一位代表基本的类别:
|
2018-08-05 16:43:10 +07:00
|
|
|
|
|
2017-12-26 15:15:13 +07:00
|
|
|
|
- 1xx,提供信息
|
|
|
|
|
- 2xx,请求成功提交
|
|
|
|
|
- 3xx,客户端重定向其他资源
|
|
|
|
|
- 4xx,请求包含错误
|
|
|
|
|
- 5xx,服务端执行遇到错误
|
|
|
|
|
|
|
|
|
|
常见的状态码及短语如下所示:
|
|
|
|
|
|
2018-08-05 16:43:10 +07:00
|
|
|
|
| 状态码 | 短语 | 描述 |
|
|
|
|
|
| --- | --- | --- |
|
|
|
|
|
| 100 | Continue | 服务端已收到请求并要求客户端继续发送主体 |
|
|
|
|
|
| 200 | Ok |已成功提交,且响应主体中包含请求结果 |
|
|
|
|
|
| 201 | Created | PUT 请求方法的返回状态,请求成功提交 |
|
|
|
|
|
| 301 | Moved Permanently | 请求永久重定向 |
|
|
|
|
|
| 302 | Found | 暂时重定向 |
|
|
|
|
|
| 304 | Not Modified | 指示浏览器使用缓存中的资源副本 |
|
|
|
|
|
| 400 | Bad Request | 客户端提交请求无效 |
|
|
|
|
|
| 401 | Unauthorized | 服务端要求身份验证 |
|
|
|
|
|
| 403 | Forbidden | 禁止访问被请求资源 |
|
|
|
|
|
| 404 | Not Found | 所请求的资源不存在 |
|
|
|
|
|
| 405 | Method Not Allowed | 请求方法不支持 |
|
|
|
|
|
| 413 | Request Entity Too Large | 请求主体过长 |
|
|
|
|
|
| 414 | Request URI Too Long | 请求URL过长 |
|
|
|
|
|
| 500 | Internal Server Error | 服务器执行请求时遇到错误 |
|
|
|
|
|
| 503 | Service Unavailable | Web 服务器正常,但请求无法被响应 |
|
2017-12-26 15:15:13 +07:00
|
|
|
|
|
2018-02-21 15:38:41 +07:00
|
|
|
|
401 状态支持的 HTTP 身份认证:
|
2018-08-05 16:43:10 +07:00
|
|
|
|
|
2017-12-26 15:15:13 +07:00
|
|
|
|
- Basic,以 Base64 编码的方式发送证书
|
|
|
|
|
- NTLM,一种质询-响应机制
|
|
|
|
|
- Digest,一种质询-响应机制,随同证书一起使用一个随机的 MD5 校验和
|
|
|
|
|
|
2018-02-21 15:38:41 +07:00
|
|
|
|
## HTTPS
|
2017-12-26 15:15:13 +07:00
|
|
|
|
|
2018-08-05 16:43:10 +07:00
|
|
|
|
HTTPS 用来弥补 HTTP 明文传输的缺陷。通过使用安全套接字 SSL,在端与端之间传输加密后的消息,保护传输数据的隐密性和完整性,并且原始的 HTTP 协议依然按照之前同样的方式运作,不需要改变。
|
2017-12-26 15:15:13 +07:00
|
|
|
|
|
2018-02-21 15:38:41 +07:00
|
|
|
|
## 参考资料
|
2018-08-05 16:43:10 +07:00
|
|
|
|
|
2018-02-21 15:38:41 +07:00
|
|
|
|
- [URL](https://en.wikipedia.org/wiki/URL)
|
|
|
|
|
- [HTTP 协议版本对比](https://www.cnblogs.com/andashu/p/6441271.html)
|
|
|
|
|
- 《黑客攻防技术宝典——Web 实战篇》
|