您的位置:首页 > Web前端 > HTML5

HTML5离线存储原理及实现

2016-11-26 13:14 253 查看


前言

使用 HTML5,通过创建 cache manifest 文件,可以轻松地创建 web 应用的离线版本。

HTML5引入了应用程序缓存,这意味着 web 应用可进行缓存,并可在没有因特网连接时进行访问。 应用程序缓存为应用带来三个优势:
离线浏览 – 用户可在应用离线时使用它们
速度 – 已缓存资源加载得更快
减少服务器负载 – 浏览器将只从服务器下载更新过或更改过的资源。


原理和环境

如上面提到的HTML5的离线存储是基于一个新建的
.appcache
文件的,通过这个文件上的
解析清单
离线存储资源,这些资源就会像cookie一样被存储了下来。之后当网络在处于离线状态下时,浏览器会通过被离线存储的数据进行页面展示。

就像cookie一样,html5的离线存储也需要服务器环境。
这里提供一个小工具——简易iis服务器,把它放在项目更目录下,双击运行即可模拟服务器环境。

链接: http://pan.baidu.com/s/1jG86UV0 密码: ja9h


解析清单

在开始之前要先了解下
manifest
(即
.appcache
文件),上面的
解析清单
要怎么写。

manifest 文件是简单的文本文件,它告知浏览器被缓存的内容(以及不缓存的内容)。

manifest 文件可分为三个部分:
CACHE MANIFEST - 在此标题下列出的文件将在首次下载后进行缓存
NETWORK - 在此标题下列出的文件需要与服务器的连接,且不会被缓存
FALLBACK - 在此标题下列出的文件规定当页面无法访问时的回退页面(比如 404 页面)

在线的情况下,用户代理每次访问页面,都会去读一次manifest.如果发现其改变, 则重新加载全部清单中的资源


CACHE MANIFEST

第一行,CACHE MANIFEST,是必需的:
CACHE MANIFEST
/theme.css
/logo.gif
/main.js


上面的 manifest 文件列出了三个资源:一个 CSS 文件,一个 GIF 图像,以及一个 JavaScript 文件。当 manifest 文件加载后,浏览器会从网站的根目录下载这三个文件。然后,无论用户何时与因特网断开连接,这些资源依然是可用的。


NETWORK

白名单,使用通配符”*”. 则会进入白名单的open状态. 这种状态下.所有不在相关Cache区域出现的url都默认使用HTTP相关缓存头策略.

下面的 NETWORK 小节规定文件 “login.asp” 永远不会被缓存,且离线时是不可用的:
NETWORK:
login.asp


可以使用星号来指示所有其他资源/文件都需要因特网连接:
NETWORK:
login.asp


FALLBACK

下面的 FALLBACK 小节规定如果无法建立因特网连接,则用 “offline.html” 替代 /html5/ 目录中的所有文件:
ALLBACK:
/html5/ /404.html


注释:第一个 URI 是资源,第二个是替补。


更新缓存

一旦应用被缓存,它就会保持缓存直到发生下列情况:
用户清空浏览器缓存
manifest 文件被修改
由程序来更新应用缓存


Demo

case/
|-- index.html
|
|-- demo.appcache
|
|-- 简易IIS服务器.exe
|
`-- image
|-- 01.jpg
`-- 02.jpg


index.html
<!DOCTYPE html>
<html lang="en" manifest="demo.appcache">
<head>
<meta charset="UTF-8">
<title>HTML5离线存储</title>
</head>
<body>
<img src="image/01.jpg" alt="">
<img src="image/02.jpg" alt="">
</body>
</html>


demo.appcache
CACHE MANIFEST
#v01
image/01.jpg

NETWORK:
*

FALLBACK:
/


image文件夹下存储着

01.jpg



02.jpg



好接着执行
简易IIS服务器.exe
试试看吧。

当iis开启时



当iis关闭时(是关闭,暂停看不出效果)



可以看见
图片1
成功被离线展示出来了,
图片2
像正常情况一样显示不出来。

现在我想把
图片2
图片1
的位置换一下呢.

Html部分置换一下
<body>
<img src="image/02.jpg" alt="">
<img src="image/01.jpg" alt="">
</body>


这时候发现问题来了,html明明修改了为什么图片没有置换过来呢,我不是在
demo.appcache
文件的
NETWORK
写了星号吗?除了
CACHE
MANIFEST
文件其它都采用在线模式。查资料得知:引入manifest的页面,即使没有被列入缓存清单中,仍然会被用户代理缓存。

好吧,那我把
.appcache
文件更新下,于是乎把头部的版本号修改一下
#v02
。刷新下页面还是没反应!再刷新,有了!为什么?

对于浏览器来说,manifest的加载是要晚于其他资源的. 这就导致check manifest的过程是滞后的.发现manifest改变.所有浏览器的实现都是紧随这做静默更新资源.以保证下次pv,应用到更新.

通过控制台我们能够窥探一二:
第一次刷新,应用程序缓存更新准备事件,



第二次刷新才会看到效果。




缓存立即执行

我们的产品已经更新了用户却要第二次进来才能够看到,这样用户体验也太差了吧,有什么方式能够解决呢?好在html5给javascript提供了相关的API。

API篇幅太多自行查看把,这里我晒下我测试成功的code:
/*code1,简单粗暴的*/
applicationCache.onupdateready = function(){
applicationCache.swapCache();
location.reload();
};
/*code2,缓存公用方法*/
// var EventUtil = {
//     addHandler: function(element, type, handler) {
//         if (element.addEventListener) {
//             element.addEventListener(type, handler, false);
//         } else if (element.attachEvent) {
//             element.attachEvent("on" + type, handler);
//         } else {
//             element["on" + type] = handler;
//         }
//     }
// };
// EventUtil.addHandler(applicationCache, "updateready", function() {      //缓存更新并已下载,要在下次进入页面生效
//     applicationCache.update();  //检查缓存manifest文件是否更新,ps:页面加载默认检查一次。
//     applicationCache.swapCache();  //交换到新的缓存项中,交换了要下次进入页面才生效
//     location.reload();              //重新载入页面
// });


code1一般用在页面加载时直接触发,而code2的方式可后期检查更新。


注意事项

站点离线存储的容量限制是5M
如果manifest文件,或者内部列举的某一个文件不能正常下载,整个更新过程将视为失败,浏览器继续全部使用老的缓存
引用manifest的html必须与manifest文件同源,在同一个域下
在manifest中使用的相对路径,相对参照物为manifest文件
CACHE MANIFEST字符串应在第一行,且必不可少
系统会自动缓存引用清单文件的 HTML 文件
manifest文件中CACHE则与NETWORK,FALLBACK的位置顺序没有关系,如果是隐式声明需要在最前面
FALLBACK中的资源必须和manifest文件同源
当一个资源被缓存后,该浏览器直接请求这个绝对路径也会访问缓存中的资源。
站点中的其他页面即使没有设置manifest属性,请求的资源如果在缓存中也从缓存中访问
当manifest文件发生改变时,资源请求本身也会触发更新
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: