您的位置:首页 > 理论基础 > 计算机网络

web资源访问过程及http协议详解

2012-07-30 10:05 260 查看
下图为在浏览器中输入URL 后的一系列过程:



从此图中可以总结出几条结论:

1. 如果DNS服务器坏了,可以直接通过ip地址访问网页,因为DNS只是一个域名和IP地址的MAP;

通过在命令行中输入 “ping 域名”即可;

比如:

在命令行中输入 ping www.baidu.com ,则出现如下文字:



可以看出 www.baidu.com 的ip地址是119.75.217.56 ;

直接在浏览器中输入 119.75.217.56 即可访问baidu;

2.Host文件位于 C:\Windows\System32\drivers\etc\hosts

此文件的用途:外挂,将游戏升级程序访问的服务器IP改成自己的机器的IP; 再比如优酷等视频网站去除广告就是通过此种方法;

在此文件中修改映射关系可以改变访问的效果,比如在文件中添加:

127.0.0.1 www.sina.com

则打开tomcat;

在浏览器中输入 http://www.sina.com:8080 可以看到tomcat的主页;

因为在访问DNS服务器之前ie会去访问 Hosts文件,如果存在映射关系,则不会去访问DNS服务器;

3.访问静态资源之前其实会访问默认Servlet,如果自己覆盖默认的Servlet,则不能正常访问到静态资源;

覆盖默认Servlet只需要<url-pattern>/</url-Pattern> 即可;

4.发送HTTP请求的前提是连接服务器;


HTTP协议总结

HTTP协议一般是隐藏在浏览器背后的,如果要查看HTTP协议内容,则需要下载IE插件 HTTPWATCH;

下载地址: http://www.99d.com/down/32/490672.html

HTTP协议时平台无关的;

HTTP由HTTP请求和HTTP响应组成;


1.HTTP请求

一般的HTTP请求如下:




1.1请求行

请求行是由 请求方式、请求资源、请求协议组成;


1.1.1请求方式

请求方式主要有GET和POST两种;

除了表单提交,其他都是GET请求;

一共有八种请求方式:

请求方式作用
get用于请求某个资源,理论上不修改服务器的状态
post表单提交
head只返回get请求后相应的头,而不用吧相应体(HTML)返回
trace显示服务器端接收的信息,用于调试
put将包含的信息放在URL中
delete指明要删除某个URL对应的资源
options列出HTTP方法列表
connect建立隧道
幂等:一次请求和多次请求的结果是一样的;

在请求方式中,满足幂等的有:HEAD、GET、PUT;其余的都不是幂等;


1.1.2请求资源

请求资源是要请求返回的web资源;


1.1.3请求协议

请求协议现在一般使用HTTP/1.1,以前使用HTTP/1.0

注意:HTTP/1.1和HTTP/1.0的区别

HTTP是基于TCP/IP之上的,HTTP/1.0是指连接web服务器后只允许一次HTTP请求;HTTP/1.1是指连接web服务器后允许多次HTTP请求;


1.2请求头

请求头是由很多Map组成;
Host客户机向服务器发送请求的主机名
Accept客户机支持的数据类型
Accept-Language客户机支持的语言

Tips:在访问www.google.com 时服务器会解析出客户机支持的语言,然后发回此语言的网页;
Accept-Charset客户机支持的编码
Accept-Encoding客户机的压缩格式
Referer客户机访问此资源的来源;比如从1.html中的超链接请求2.html,则请求2.html时会发送Referer: 1.html

用途:防盗链

避免从未知网站链接此网站,盗用资源
User-Agent客户机的软件环境
Connection客户机发送此连接后的连接状态时继续连接还是断开
Date客户机发送的时间
注意:请求头和实际内容中间需要加上空行;


2.HTTP响应




2.1 响应行


2.2.1 状态码

100-199服务器成功接收客户请求,不过需要让客户机继续发送请求完成整个请求过程
200-299200 成功处理
300-399302 : 找别人,在响应头中需要有location属性; 304、307:找缓存,即缓存中存在页面
400-499403:存在页面,但是用户没有权限访问; 404:无此页面
500-599500 : 服务器内部错误


2.2 响应头

Server服务器信息
Content-Length响应内容的长度
Content-Encoding服务器内容的压缩格式
Content-Type服务器内容的格式,比如text/html ; image/jpeg
location用于状态码为302,表示别人的地址
Content-disposition下载返回的数据
Transfer-Encoding以块传输还是以字节传输
Date时间
refresh定时刷新或重定向
Last-Modified最后改变的时间
Expires-1或0 表示无缓存
ETag每个web资源都有一个标示符,只要web资源内容改动,标示符就会改变;
应用1:location重定向

[java] view
plaincopy

response.setStatus(302);

response.setHeader("location","http://localhost:8080/a/1.html");

应用2:content-Encoding 压缩数据

[java] view
plaincopy

response.setHeader("content-encoding","gzip");

ByteArrayOutputStream bout = new ByteArrayOutputStream();

GZIPOutputStream out = new GZIPOutputStream(bout);

out.write("Hello".getBytes());

out.close();

byte[] b = bout.toByteArray();

response.getOutputStream().write(b);

电信对于网站的收费是按照出口流量收费的,因此需要压缩数据,减少费用;

应用3:content-disposition

response.setHeader("content-disposition","attachment;filename=1.jpg");

应用4:refresh

response.setHeader("refresh","3"); 定时更新 用于实时软件

response.setHeader("refresh","3;url='http://localhost:8080/1.html'"); 注册登录

应用5:content-type 返回的数据类型;

[java] view
plaincopy

public void doGet(HttpServletRequest request, HttpServletResponse response) throws ServletException, IOException {

response.setHeader("content-type", "image/ipeg");

InputStream in = this.getServletContext().getResourceAsStream("/1.jpg");

java.io.OutputStream out = response.getOutputStream();

byte[]b = new byte[1024];

int length = 0;

while((length=in.read(b))>0){

out.write(b, 0, length);

}

out.close();

}
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: 
相关文章推荐