您的位置:首页 > 理论基础 > 计算机网络

HTTP缓存策略总结

2018-01-21 01:17 246 查看
所有的缓存都是基于一套规则来帮助他们决定什么时候使用缓存中的副本提供服务(假设有副本可用的情况下,未被销毁回收或者未被删除修改)。这些规则有的在协议中有定义(如HTTP1.0和HTTP1.1),有的则是由缓存的管理员设置(如DBA、浏览器的用户、代理服务器管理员或者应用开发者).

浏览器的缓存规则

对于浏览器端的缓存来讲,这些规则是在HTTP协议头和HTML页面的Meta标签中定义的。他们分别从新鲜度和校验值两个维度来规定浏览器是否可以直接使用缓存中的副本,还是需要去原服务器获取更新的版本。

新鲜度(过期机制):也就是缓存副本有效期

校验值(验证机制):服务器返回资源的时候有时在控制头信息带上这个资源的实体标签eTag,它可以用来作为再次请求过程的校验标识。如果发现校验标识不匹配,说明资源已经被修改或过期,浏览器需求重新获取资源内容。

浏览器缓存的控制

使用缓存有关的HTTP消息报头



Cache-Control与Expires

Cache-Control与Expires的作用一致,都是指明当前资源的有效期,如果在有效期内,浏览器直接读取缓存中的数据并返回200 from cache,不需要发送请求到服务器。如果不在有效期内,则发送请求。只不过Cache-Control的选择更多,设置更细致,如果同时设置的话,其优先级高于Expires。

Last-Modified与ETage

服务器将资源传递给客户端时,会将资源最后更改的事件以Last-Modified:GMT的形式加载实体首部上一起返回给客户端。客户端会为资源标记上该信息,下次再次请求时,会把该信息附带在请求头(‘If-Modified-Since’)一并带给服务器去做检查,若传输的时间值与服务器上该资源最终修改时间是一致的,则说明该资源没有被修改过,直接返回304状态码即可。

Last-Modified有一个缺点,如果在服务器上,一个资源被修改了,但是实际内容根本没有发生改变,会因为Last-Modified时间匹配不上而返回了整个实例给客户端(即使客户端缓存里有个一模一样的资源)。

为了解决上述Last-modified可能存在的不准确的问题,HTTP1.1推出了ETag实体首部字段

服务器会通过某种算法,给资源计算得出一个唯一标识符,在把资源响应给客户端的时候,会在实体首部加上ETag一起返回给客户端

客户端会保留该ETag字段,并在下一次请求时将其一并带过去给服务器(请求头If-None-Match)。服务器只需要比较客户端传来的ETag跟自己服务器上资源的ETag是否一致,就能很好地判断资源相对客户端而言是否被修改过,如果服务器发现ETag匹配不上,那么直接以常规GET200回包形式将新的资源(包括新的ETag)发给客户端;如果ETag是一致的,则直接返回304知会客户端直接使用本地缓存即可。

Last-Modified/ETag与Cache-Control/Expires

配置Last-Modified/ETag的情况下,浏览器再次访问资源的时候,还是会发送请求到服务器询问是否已经修改,如果没有,服务器发送304状态码给浏览器,告诉浏览器直接从自己本地缓存中读取数据,如果修改过那就整个数据重新发给浏览器

Cache-Control/Expires则不同,如果检测到本地的缓存还是有效的事件范围内,浏览器直接使用本地副本,不会发送任何请求。两者一起使用时,Cache-Control/Expires的优先级要高于Last-Modified/ETag。即当本地副本根据Cache-Control/Expires发现还在有效期内时,则不会再发送请求去服务器询问修改时间(Last-Modified)或实体标识(ETag)了。所以,当一些资源有可能改动比较频繁时,设置过期时间要短,不然会发生服务器端更新了资源,浏览器因为读的是缓存而不能加载最新资源。

用户操作行为与缓存



通过上表我们可以看到,当用户在按F5进行刷新的时候,会忽略Expires/Cache-Control的设置,会再次发送请求去服务器请求,而Last-Modified/Etag还是有效的,服务器会根据情况判断返回304还是200;而当用户使用Ctrl+F5进行强制刷新的时候,只是所有的缓存机制都将失效,重新从服务器拉去资源。

一般情况下,使用Cache-Control/Expires会配合Last-Modified/ETag一起使用,因为即使服务器设置缓存时间, 当用户点击“刷新”按钮时,浏览器会忽略缓存继续向服务器发送请求,这时Last-Modified/ETag将能够很好利用304,从而减少响应开销。

不能被缓存的请求

无法被浏览器缓存的请求:

HTTP信息头中包含Cache-Control:no-cache,pragma:no-cache(HTTP1.0),或Cache-Control:max-age=0等告诉浏览器不用缓存的请求

需要根据Cookie,认证信息等决定输入内容的动态请求是不能被缓存的

经过HTTPS安全加密的请求(有人也经过测试发现,ie其实在头部加入Cache-Control:max-age信息,firefox在头部加入Cache-Control:Public之后,能够对HTTPS的资源进行缓存,参考HTTPS的七个误解)

POST请求无法被缓存

HTTP响应头中不包含Last-Modified/Etag,也不包含Cache-Control/Expires的请求无法被缓存。

引用全图介绍:

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: