您的位置:首页 > Web前端 > HTML5

HTML5离线存储原理

2017-11-27 19:47 405 查看

HTML5离线存储原理

  使用 HTML5,通过创建 cache manifest 文件,可轻松创建 web 应用的离线版本

  HTML5 引入了应用程序缓存,这意味着web应用可进行缓存,并可在没有网络时进行访问。

  应用程序缓存为应用带来三个优势

离线浏览:用户可在离线时使用它们。

速度:已经缓存的资源加载得更快。

减少服务器负载:浏览器将只从服务器下载更改过的资源。

  目录:

HTML5离线存储原理
原理和环境

解析清单
CACHE MANIFEST

NETWORK

FALLBACK

更新缓存

Demo

缓存立即执行

注意事项

原理和环境

  如上面提到的 HTML5 的离线存储是基于一个新建的
.appcache
文件的,通过这个文件上的解析清单离线存储资源,这些资源就会像 cookie 一样被存储了下来。之后当网络在处于离线状态下时,浏览器会通过被离线存储的数据进行页面展示。

  就像cookie一样,html5 的离线存储也需要服务器环境。

解析清单

  在开始之前要先了解下
manifest
(即 .appcache 文件),上面的解析清单要怎么写。

  manifest 文件是简单的文本文件,它告知浏览器被缓存的内容(以及不缓存的内容)。

manifest 文件可分为三个部分

CACHE MANIFEST :在此标题下列出的文件将在首次下载后进行缓存。

NETWORK :在此标题下列出的文件需要与服务器的连接,且不会被缓存。

FALLBACK:在此标题下列出的文件规定当页面无法访问时的回退页面(比如 404 页面)。

  在线的情况下,用户代理每次访问页面,都会去读一次 manifest,如果发现其改变, 则重新加载全部清单中的资源

CACHE MANIFEST

  第一行,CACHE MANIFEST,是必需的:

CACHE MANIFEST /theme.css /logo.gif /main.js


  上面的 manifest 文件列出了三个资源:一个 CSS 文件,一个 GIF 图像,以及一个 JavaScript 文件。当 manifest 文件加载后,浏览器会从网站的根目录下载这三个文件。然后,无论用户何时与因特网断开连接,这些资源依然是可用的。

NETWORK

  下面的 NETWORK 小节规定文件 “login.asp” 永远不会被缓存,且离线时是不可用的

NETWORK: login.asp


  可以使用 “*” 来指示所有其他资源/文件都需要因特网连接:

NETWORK: *


白名单,使用通配符 “*”。 则会进入白名单的 open 状态。这种状态下,所有不在相关 Cache 区域出现的 url 都默认使用HTTP相关缓存头策略

FALLBACK

  下面的 FALLBACK 小节规定如果无法建立因特网连接,则用 “offline.html” 替代 /html5/ 目录中的所有文件:

FALLBACK:/html5/ /404.html


注释:第一个 URI 是资源,第二个是替补。

更新缓存

  一旦应用被缓存,它就会保持缓存直到发生下列情况:

用户清空浏览器缓存。

manifest 文件被修改。

由程序来更新应用缓存。

Demo

|-- index.html
|-- demo.appcache
|-- image
|-- 01.jpg
|-- 02.jpg


// index.html
<!DOCTYPE html>
<html lang="en" manifest="demo.appcache">
<head>
<meta charset="UTF-8">
<title>HTML5离线存储</title>
</head>
<body>
<img src="image/01.jpg" alt="">
<img src="image/02.jpg" alt="">
</body>
</html>


// demo.appcache
CACHE MANIFEST #v01 image/01.jpg
NETWORK: *
FALLBACK: /


  image 文件夹下存储着:

    01.jpg

      


    02.jpg

      


  当服务器开启时:



  当服务器关闭时(是关闭,暂停看不出效果):



  可以看见图片1成功被离线展示出来了,图片2像正常情况一样显示不出来。

  现在我想把图片2和图片1的位置换一下呢:

<body>
<img src="image/02.jpg" alt="">
<img src="image/01.jpg" alt="">
</body>


  这时候发现问题来了,html 明明修改了为什么图片没有置换过来呢,我不是在 demo.appcache 文件NETWORK 写了星号吗?除了 CACHE MANIFEST 文件其它都采用在线模式。查资料得知:引入 manifest 的页面,即使没有被列入缓存清单中,仍然会被用户代理缓存。

  好吧,那我把 .appcache 文件更新下,于是乎把头部的版本号修改一下 #v02。刷新下页面还是没反应!再刷新,有了!为什么?

  对于浏览器来说,manifest 的加载是要晚于其他资源的。这就导致 check manifest 的过程是滞后的。发现 manifest 改变。所有浏览器的实现都是紧随着做静默更新资源。以保证下次pv,应用到更新。

  通过控制台我们能够窥探一二:

  第一次刷新,应用程序缓存更新准备事件:

    


  第二次刷新才会看到效果:

    


缓存立即执行

  我们的产品已经更新了用户却要第二次进来才能够看到,这样用户体验也太差了吧,有什么方式能够解决呢?好在 html5javascript 提供了相关的 API

  API 篇幅太多自行查看吧,这里我晒下我测试成功的 code:

/* code1,简单粗暴的 */
applicationCache.onupdateready = function(){
applicationCache.swapCache();
location.reload();
};


/* code2,缓存公用方法 */
var EventUtil = {
addHandler: function(element, type, handler) {
if (element.addEventListener) {
element.addEventListener(type, handler, false);
} else if (element.attachEvent) {
element.attachEvent(“on” + type, handler);
} else {
element["on" + type] = handler;
}
}
};
EventUtil.addHandler(applicationCache, “updateready”, function() {
// 缓存更新并已下载,要在下次进入页面生效
// 检查缓存 manifest 文件是否更新 ps:页面加载默认检查一次。
applicationCache.update();
// 交换到新的缓存项中,交换了要下次进入页面才生效
applicationCache.swapCache();

location.reload(); // 重新载入页面
});


  code1 一般用在页面加载时直接触发,而 code2 的方式可后期检查更新

注意事项

站点离线存储的容量限制是5M

如果 manifest 文件,或者内部列举的某一个文件不能正常下载,整个更新过程将视为失败,浏览器继续全部使用老的缓存。

引用 manifest 的 html 必须与 manifest 文件同源,在同一个域下。

在 manifest 中使用的相对路径,相对参照物为 manifest 文件。

CACHE MANIFEST 字符串应在第一行,且必不可少

系统会自动缓存引用清单文件的 HTML 文件

manifest 文件中 CACHE 则与 NETWORK、FALLBACK 的位置顺序没有关系,如果是隐式声明需要在最前面。

FALLBACK 中的资源必须和 manifest 文件同源

当一个资源被缓存后,该浏览器直接请求这个绝对路径也会访问缓存中的资源。

站点中的其他页面即使没有设置 manifest 属性,请求的资源如果在缓存中也从缓存中访问。

当 manifest 文件发生改变时,资源请求本身也会触发更新

原文出处:HTML5离线存储原理及实现
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息