您的位置:首页 > 编程语言 > Python开发

Python爬虫小项目——实现英语翻译功能(三)

2020-06-27 05:31 871 查看

做模拟真实用户向服务器发送请求前应该对http请求响应过程有一个大致的了解

http请求响应过程

http请求响应过程

如下图所示,http请求响应过程大致分为下面四部分,在这里我们主要关注第2,4步,即发送请求的内容,和关闭连接后浏览器接受到服务器响应的数据

浏览器向服务器发送请求

请求的内容一般分为四部分

1、HTTP请求的方法或者动作,GET或者POST等
Request Method: POST

2、请求地址URL(你连URL地址都没有你请求什么)
Request URL:http://fanyi.youdao.com/

3、请求头,包含客户端环境信息,身份验证信息
客户端浏览器请求Header(HTTP request header)

Accept 可接受的内容类型
Accept-Language 语言
Accept-Encoding 可接受的压缩类型 gzip,deflate

4、请求体,即请求正文,请求正文可以包含客户提交的查询字符,表单信息等等

服务器关闭TCP连接以及浏览器接受到服务器响应的数据

一般情况下,一旦 Web 服务器向浏览器发送了请求的数据,它就要关闭 TCP 连接,但是如果浏览器或者服务器在其头信息加入了这行代码:Connection:keep-alive
TCP连接在发送后将仍然保持打开状态,于是,浏览器可以继续通过相同的连接发送请求。保持连接节省了为每个请求建立新连接所需的时间,还节约了网络带宽。

HTTP响应的内容由三部分组成:

1、一个数字与文字组成的状态码,用来显示请求成功失败信息
Status Code: 200 OK

2、响应头,响应头与请求头包含许多有用信息,例如:服务器类型、日期时间、内容类型和长度等。
服务器端的响应Header(response header)

Connection:keep-alive( 针对该连接所预期的选项)
Content-Disposition:inline;filename=f.txt( 对已知MIME类型资源的描述,浏览器可以根据这个响应头决定是对返回资源的动作,如:将其下载或是打开。)
Content-Type:application/json;charset=UTF-8( 当前内容的MIME类型)

3、响应体,响应正文

下一篇文章

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: