您的位置：首页 > 理论基础 > 计算机网络

HTTP协议知识

2014-04-18 21:24 176 查看

转载自：http://libin52008.blog.163.com/blog/static/105327187201262185140829/

一：Http的工作方式
HTTP协议采用了请求/响应的工作方式。基于HTTP1.0协议的客户端在每次向服务器发出请求后，服务器就会向客户端返回响应消息（包括请求是否正确以及所请求的数据），在确认客户端已经收到响应消息后，服务端就会关闭网络连接（其实是关闭TCP连接）。在这个数据传输过程中，并不保存任何历史信息和状态信息，因此，HTTP协议也被认为是无状态的协议
在HTTP1.0协议中，当Web浏览器发出请求时，就意味着一个请求/响应会话已经开始。在请求、响应结束后，服务器就会立刻关闭这个连接。这种会话方式虽然简便，但它会带来另外一个问题。如果客户端浏览器访问的某个HTML或其他类型的Web页中包含有其他的Web资源，如JavaScript文件、图像文件、CSS文件等；当浏览器每遇到这样一个Web资源，就会建立一个HTTP会话。如果这样的资源很多的话，就会加重服务器的负担，同时也会影响客户端浏览器加载HTML等Web资源的效率。

[align=left] 在对上述的缺陷进行改进和完善后，HTTP1.1协议进入了我们的视线。HTTP1.1和HTTP1.0相比较而言，最大的区别就是增加了持久连接支持。当客户端使用HTTP1.1协议连接到服务器后，服务器就将关闭客户端连接的主动权交还给客户端；也就是说，在客户端向服务器发送一个请求并接收以一个响应后，只要不调用Socket类的close方法关闭网络连接，就可以继续向服务器发送HTTP请求。当HTML中含有其他的Web资源时，浏览器就可以使用同一个网络连接向下载这些资源，这样就可以大大减轻服务器的压力。图演示了这一过程。[/align]
HTTP1.1除了支持持久连接外，还将HTTP1.0的请求方法从原来的三个(GET、POST和HEAD)扩展到了八个（OPTIONS、GET、HEAD、POST、PUT、DELETE、TRACE和CONNECT）。而且还增加了很多请求和响应字段，如上述的持久连接的字段Connection。这个字段有两个值，Close和Keep-Alive。如果使用Connection:Close，则关闭HTTP1.1的持久连接的功能，要打开HTTP1.1的持久连接的功能，必须使用Connection:Keep-Alive，或者不加Connection字段（因为HTTP1.1在默认情况下就是持久连接的）。除了这些，还提供了身份认证、状态管理和缓存（Cache）等相关的请求头和响应头。

[align=left]二：HTTP和SOCKET的区别[/align]
1、TCP连接

手机能够使用联网功能是因为手机底层实现了TCP/IP协议，可以使手机终端通过无线网络建立TCP连接。TCP协议可以对上层网络提供接口，使上层网络数据的传输建立在“无差别”的网络之上。

建立起一个TCP连接需要经过“三次握手”：

第一次握手：客户端发送syn包(syn=j)到服务器，并进入SYN_SEND状态，等待服务器确认；

第二次握手：服务器收到syn包，必须确认客户的SYN（ack=j+1），同时自己也发送一个SYN包（syn=k），即SYN+ACK包，此时服务器进入SYN_RECV状态；

第三次握手：客户端收到服务器的SYN＋ACK包，向服务器发送确认包ACK(ack=k+1)，此包发送完毕，客户端和服务器进入ESTABLISHED状态，完成三次握手。

握手过程中传送的包里不包含数据，三次握手完毕后，客户端与服务器才正式开始传送数据。理想状态下，TCP连接一旦建立，在通信双方中的任何一方主动关闭连接之前，TCP 连接都将被一直保持下去。断开连接时服务器和客户端均可以主动发起断开TCP连接的请求，断开过程需要经过“四次握手”（过程就不细写了，就是服务器和客户端交互，最终确定断开）

2、HTTP连接

HTTP协议即超文本传送协议(Hypertext Transfer Protocol )，是Web联网的基础，也是手机联网常用的协议之一，HTTP协议是建立在TCP协议之上的一种应用。

HTTP连接最显著的特点是客户端发送的每次请求都需要服务器回送响应，在请求结束后，会主动释放连接。从建立连接到关闭连接的过程称为“一次连接”。

1）在HTTP 1.0中，客户端的每次请求都要求建立一次单独的连接，在处理完本次请求后，就自动释放连接。

2）在HTTP 1.1中则可以在一次连接中处理多个请求，并且多个请求可以重叠进行，不需要等待一个请求结束后再发送下一个请求。

由于HTTP在每次请求结束后都会主动释放连接，因此HTTP连接是一种“短连接”，要保持客户端程序的在线状态，需要不断地向服务器发起连接请求。通常的做法是即时不需要获得任何数据，客户端也保持每隔一段固定的时间向服务器发送一次“保持连接”的请求，服务器在收到该请求后对客户端进行回复，表明知道客户端“在线”。若服务器长时间无法收到客户端的请求，则认为客户端“下线”，若客户端长时间无法收到服务器的回复，则认为网络已经断开。

3、SOCKET原理

3.1套接字（socket）概念

套接字（socket）是通信的基石，是支持TCP/IP协议的网络通信的基本操作单元。它是网络通信过程中端点的抽象表示，包含进行网络通信必须的五种信息：连接使用的协议，本地主机的IP地址，本地进程的协议端口，远地主机的IP地址，远地进程的协议端口。

应用层通过传输层进行数据通信时，TCP会遇到同时为多个应用程序进程提供并发服务的问题。多个TCP连接或多个应用程序进程可能需要通过同一个 TCP协议端口传输数据。为了区别不同的应用程序进程和连接，许多计算机操作系统为应用程序与TCP／IP协议交互提供了套接字(Socket)接口。应用层可以和传输层通过Socket接口，区分来自不同应用程序进程或网络连接的通信，实现数据传输的并发服务。

3.2 建立socket连接

建立Socket连接至少需要一对套接字，其中一个运行于客户端，称为ClientSocket ，另一个运行于服务器端，称为ServerSocket 。

套接字之间的连接过程分为三个步骤：服务器监听，客户端请求，连接确认。

服务器监听：服务器端套接字并不定位具体的客户端套接字，而是处于等待连接的状态，实时监控网络状态，等待客户端的连接请求。

客户端请求：指客户端的套接字提出连接请求，要连接的目标是服务器端的套接字。为此，客户端的套接字必须首先描述它要连接的服务器的套接字，指出服务器端套接字的地址和端口号，然后就向服务器端套接字提出连接请求。

连接确认：当服务器端套接字监听到或者说接收到客户端套接字的连接请求时，就响应客户端套接字的请求，建立一个新的线程，把服务器端套接字的描述发给客户端，一旦客户端确认了此描述，双方就正式建立连接。而服务器端套接字继续处于监听状态，继续接收其他客户端套接字的连接请求。

4、SOCKET连接与TCP连接

创建Socket连接时，可以指定使用的传输层协议，Socket可以支持不同的传输层协议（TCP或UDP），当使用TCP协议进行连接时，该Socket连接就是一个TCP连接。

5、Socket连接与HTTP连接

由于通常情况下Socket连接就是TCP连接，因此Socket连接一旦建立，通信双方即可开始相互发送数据内容，直到双方连接断开。但在实际网络应用中，客户端到服务器之间的通信往往需要穿越多个中间节点，例如路由器、网关、防火墙等，大部分防火墙默认会关闭长时间处于非活跃状态的连接而导致 Socket 连接断连，因此需要通过轮询告诉网络，该连接处于活跃状态。

而HTTP连接使用的是“请求—响应”的方式，不仅在请求时需要先建立连接，而且需要客户端向服务器发出请求后，服务器端才能回复数据。

很多情况下，需要服务器端主动向客户端推送数据，保持客户端与服务器数据的实时与同步。此时若双方建立的是Socket连接，服务器就可以直接将数据传送给客户端；若双方建立的是HTTP连接，则服务器需要等到客户端发送一次请求后才能将数据传回给客户端，因此，客户端定时向服务器端发送连接请求，不仅可以保持在线，同时也是在“询问”服务器是否有新的数据，如果有就将数据传给客户端。
[align=left]三：关于Http中的KeepAlive属性[/align]

首先就看一下KeepAlive出现的原因吧：

当一个客户端向服务器发送http请求时，两者之间会建立一个tcp连接，然后服务器发回响应信息同时关闭连接。如果请求的的页面中含有别的资源连接，比如图片、flsah等，就会再次创建连接。KeepAlive的作用就是在第一次创建连接时，服务器会把这个tcp连接保持一段时间（服务器端会有一个keepaliveTime的最大时间，超过时间就断开连接）。这样就不会频繁的去建立tcp连接，同一次请求中的信息传递都可以使用同一个tcp连接。

KeepAlive的工作原理：

在HTTP1.0和HTTP1.1协议中都有对KeepAlive的支持。其中HTTP1.0需要在request中增加“Connection： keep-alive” header才能够支持，而HTTP1.1默认支持。（大家可以利用抓包工具看一下）

HTTP1.0 KeepAlive支持的数据交互流程如下：

a)Client发出request，其中该request的HTTP版本号为1.0。同是在request中包含一个header：“Connection： keep-alive”。

b)Web Server收到request中的HTTP协议为1.0及“Connection： keep-alive”就认为是一个长连接请求，其将在response的header中也增加“Connection： keep-alive”。同是不会关闭已建立的tcp连接。

c)Client收到Web Server的response中包含“Connection： keep-alive”，就认为是一个长连接，不close tcp连接。并用该tcp连接再发送request。（跳转到a)）

HTTP1.1 KeepAlive支持的数据交互流程如下：

a)Client发出request，其中该request的HTTP版本号为1.1。

b)Web Server收到request中的HTTP协议为1.1就认为是一个长连接请求，其将在response的header中也增加“Connection： keep-alive”。同是不会关闭已建立的tcp连接。

c)Client收到Web Server的response中包含“Connection： keep-alive”，就认为是一个长连接，不close tcp连接。并用该tcp连接再发送request。（跳转到a)）

关于KeepAlive的分析：

现在的一些服务器都可以设置KeepAlive是否开启，以及KeepAlive的超时时间，服务器支持的KeepAlive数量（数量一般不会很大，否则会对服务器产生很大的压力）。

那么我们考虑3种情况：

　　1、用户浏览一个网页时，除了网页本身外，还引用了多个 javascript 文件，多个 css 文件，多个图片文件，并且这些文件都在同一个 HTTP 服务器上。

　　2、用户浏览一个网页时，除了网页本身外，还引用一个 javascript 文件，一个图片文件。

　　3、用户浏览的是一个动态网页，由程序即时生成内容，并且不引用其他内容。

对于上面3中情况，1 最适合打开 KeepAlive ，2 随意，3 最适合关闭 KeepAlive

打开 KeepAlive 后，意味着每次用户完成全部访问后，都要保持一定时间后才关闭会关闭 TCP 连接，那么在关闭连接之前，必然会有一个服务器进程对应于该用户而不能处理其他用户，假设 KeepAlive 的超时时间为 10 秒种，服务器每秒处理 50 个独立用户访问，那么系统中 Apache 的总进程数就是 10 * 50 ＝ 500 个，如果一个进程占用 4M 内存，那么总共会消耗 2G 内存，所以可以看出，在这种配置中，相当消耗内存，但好处是系统只处理了 50次 TCP 的握手和关闭操作。

如果关闭 KeepAlive，如果还是每秒50个用户访问，如果用户每次连续的请求数为3个，那么 Apache 的总进程数就是 50 * 3 = 150 个，如果还是每个进程占用 4M 内存，那么总的内存消耗为 600M，这种配置能节省大量内存，但是，系统处理了 150 次 TCP 的握手和关闭的操作，因此又会多消耗一些 CPU 资源。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航