您的位置：首页 > 理论基础 > 计算机网络

直接用socket实现HTTP协议(下载专用)

2014-07-28 20:25 316 查看

从HTTP服务器上下载一个文件有很多方法，“热心”的微软提供了 WinInet 类，用起来也很方便。当然，我们也可以自己实现这些功能，通过格式化请求头很容易就能实现断点续传和检查更新等等功能。本文附带的工程中有一个支持 HTTP1.1 协议，直接用 Socket 实现下载功能的 DLL，实现了以下功能：

1.连接主机

2.格式化请求头

3.设置接收,发送超时

4.接收并分析回应头

连接，发送，设置超时，接收数据等我就不细说了，windows socket早就做好了，调用相应的函数就OK了。

要想从服务器下载文件，首先要向服务器发送一个请求。HTTP 请求头由若干行字符串组成。下面结合实例说说 HTTP 请求头的格式。假设要下载 http://www.sina.com.cn/index.html 这个网页，那么请求头的写法如下：

第1行：方法，请求的内容，HTTP协议的版本

下载一般可以用GET方法，请求的内容是“/index.html”，HTTP协议的版本是指浏览器支持的版本，对于下载软件来说无所谓，所以用1.1版 “HTTP/1.1”；

“GET /index.html HTTP/1.1”

第2行：主机名，格式为“Host:主机”

在这个例子中是：“Host:www.sina.com.cn”

第3行：接受的数据类型，下载软件当然要接收所有的数据类型，所以：

“Accept:*/*”

第4行：指定浏览器的类型

有些服务器会根据客户服务器种类的不同会增加或减少一些内容，在这个例子中可以这样写：

1.

“User-Agent:Mozilla/4.0
(compatible; MSIE 5.00; Windows 98)”

第5行：连接设置

设定为一直保持连接：“Connection:Keep-Alive”

第6行：若要实现断点续传则要指定从什么位置起接收数据，格式如下：

1.

“Range:
bytes=起始位置 - 终止位置”

比如要读前500个字节可以这样写：“Range: bytes=0 - 499”；从第 1000 个字节起开始下载：

1.

“Range:
bytes=999 -”

最后，别忘了加上一行空行，表示请求头结束。整个请求头如下：

1.

GET
/index.html HTTP/1.1

2.

Host:www.sina.com.cn

3.

Accept:*/*

4.

User-Agent:Mozilla/4.0
(compatible; MSIE 5.00; Windows 98)

5.

Connection:Keep-Alive

CHttpSocket 提供了 FormatRequestHeader()函数，用以格式化输出HTTP请求头。代码如下：

01.

///根据请求的相对URL输出HTTP请求头

02.

const

char

*CHttpSocket::FormatRequestHeader(

char

*pServer,

char

*pObject,

long

&Length,

03.

char

*pCookie,

char

*pReferer,

long

nFrom,

04.

long

nTo,

int

nServerType)

05.

06.

char

szPort[10];

07.

char

szTemp[20];

08.

sprintf

(szPort,

"%d"

,m_port);

09.

memset

(m_requestheader,

''

\0

''

,1024);

10.

11.

///第1行:方法,请求的路径,版本

12.

strcat

(m_requestheader,

"GET
"

);

13.

strcat

(m_requestheader,pObject);

14.

strcat

(m_requestheader,

"
HTTP/1.1"

);

15.

strcat

(m_requestheader,

"\r\n"

);

16.

17.

///第2行:主机

18.

strcat

(m_requestheader,

"Host:"

);

19.

strcat

(m_requestheader,pServer);

20.

strcat

(m_requestheader,

"\r\n"

);

21.

22.

///第3行:

23.

if

(pReferer
!= NULL)

24.

25.

strcat

(m_requestheader,

"Referer:"

);

26.

strcat

(m_requestheader,pReferer);

27.

strcat

(m_requestheader,

"\r\n"

);

28.

29.

30.

///第4行:接收的数据类型

31.

strcat

(m_requestheader,

"Accept:*/*"

);

32.

strcat

(m_requestheader,

"\r\n"

);

33.

34.

///第5行:浏览器类型

35.

strcat

(m_requestheader,

"User-Agent:Mozilla/4.0
(compatible; MSIE 5.00; Windows 98)"

);

36.

strcat

(m_requestheader,

"\r\n"

);

37.

38.

///第6行:连接设置,保持

39.

strcat

(m_requestheader,

"Connection:Keep-Alive"

);

40.

strcat

(m_requestheader,

"\r\n"

);

41.

42.

///第7行:Cookie.

43.

if

(pCookie
!= NULL)

44.

45.

strcat

(m_requestheader,

"Set
Cookie:0"

);

46.

strcat

(m_requestheader,pCookie);

47.

strcat

(m_requestheader,

"\r\n"

);

48.

49.

50.

///第8行:请求的数据起始字节位置(断点续传的关键)

51.

if

(nFrom
> 0)

52.

53.

strcat

(m_requestheader,

"Range:
bytes="

);

54.

_ltoa(nFrom,szTemp,10);

55.

strcat

(m_requestheader,szTemp);

56.

strcat

(m_requestheader,

"-"

);

57.

if

(nTo
> nFrom)

58.

59.

_ltoa(nTo,szTemp,10);

60.

strcat

(m_requestheader,szTemp);

61.

62.

strcat

(m_requestheader,

"\r\n"

);

63.

64.

65.

///最后一行:空行

66.

strcat

(m_requestheader,

"\r\n"

);

67.

68.

///返回结果

69.

Length=

strlen

(m_requestheader);

70.

return

m_requestheader;

71.

请求头发送给服务器后就可以接收来自服务器的回应头了。回应头也是由若干行字符串组成，除了第一行和最后一个空行以外，每一行都由一个域和一个值组成。第一行包括了服务器的回应状态，从 2XX 到 5XX，每个状态码都有不同的意思，详细内容可以查看RFC文档下载需要关心的有：2XX表示成功，可以继续读取数据；3XX表示目标已经转移，新的地址在“Location”域中；4XX表示客户端错，可能是下载地址不对，等等；5XX表示服务器端错。回应头中的域有“Content-Length”，“Accept-Ranges”，“Content-Type”，“Date”，“Last-Modified”，“Location”等等内容
，下载比较关心的域有“Content-Length”域和“Location”域。“Content-Length”表示下载文件的大小，“Location”表示目标的实际存放位置，当回应码为3XX时就要用该域中的值重新连接。

附带源码中的 CHttpSocket 类提供了以下几个方法，分别用来读取服务器状态码，某个域的值，回应头中的一行以及整个回应头：

1.

int

GetServerState();

//返回服务器状态码
-1表示不成功

2.

int

GetField(

const

char

*
szSession,

char

*szValue,

int

nMaxLength);

//返回某个域值,-1表示不成功

3.

int

GetResponseLine(

char

*pLine,

int

nMaxLength);

//获取返回头的一行

4.

const

char

*
GetResponseHeader(

int

&Length);

取得回应头后，如果回应码为2XX并且“Content-Length”的值不等于0就表示可以接收下载文件数据了，接下来的工作就很简单了，调用 CHttpSocket::Recevie()直到接收的数据长度等于“Content-Length”的值就可以了。

一个完整的使用过程由以下几个步骤组成：

1.调用AfxParseURL()分析URL得到Server和下载路径；

2.调用CHttpSocket::Socket()创建套接字；

3.调用CHttpSocket::Connect()连接服务器；

4.调用CHttpSocket::FormatRequestHeader()格式化请求头；

5.调用CHttpSocket::SendRequest()向服务器发送请求头；

6.调用CHttpSocket::GetServerState()得到回应状态码；

7.调用CHttpSocket::GetField("Content-Length")得到下载文件的大小；

8.调用CHttpSocket::Receive()接收数据直到数据接收完成；

本文附带源代码还包括了一个使用 CHttpSocket 实现下载功能的例子工程。注意，所有的调用都是阻塞的，所以最好为一个下载任务创建一个线程，否则会导致界面无法响应用户输入。程序运行界面如下图所示：

该图显示了请求头，回应头以及下载进度。

当然，要真正实现多任务多线程下载还有很多工作要做。本文仅仅讨论了自己实现下载的一种可能性，希望对读者有所帮助。欢迎来Mail指教。

转自：http://www.vckbase.com/index.php/wv/938

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航