您的位置:首页 > Web前端 > HTML5

HTML5的全局属性

2015-07-02 16:25 344 查看
HTML5的搜索优化

在HTML5中新增了全局属性的概念。所谓全局属性是指可以对任何元素都使用的属性。

1.contentEditable属性

contentEditable属性是判定用户是否可以编辑元素中的内容,它是一个boolean属性,true的时候可以编辑,false的时候不可以编辑。

2.designMode属性

designMode属性用来制定整个页面是否可编辑,designMode属性有两个值,on和off,当属性为on时,页面可编辑,designMode属性只能在JavaScript脚本来制定。

Eg:document.designMode=”on”

3.hidden属性

HTML5中,所有元素都有一个hidden属性。该属性通知浏览器不渲染元素,使该元素处于不可见状态,true和false两个值,在页面装载后允许使用JavaScript脚本取消。

4.spellcheck属性

Spellcheck属性是HTML5 针对input元素(type=text)与textarea这两个文本输入框提供的一个新属性,它对用户输入的文本内容进行拼写和语法检查,有true和false两个值,在使用时必须声明。

5.tabindex属性

Tabindex属性是确定按tab键元素访问的顺序。

考虑到HTML5的优化,首先得了解搜索引擎的爬虫,搜索引擎的处理对象是互联网网页,日前网页数量以百亿计,所以搜索引擎首先面临的问题就是:如何能够设计出高效的下载系统,以将如此海量的网页数据传送到本地,在本地形成互联网网页的镜像备份。网络爬虫的工作原理是首先从互联网页面中精心选择一部分网页,以这些网页的链接地址作为种子URL,将这些种子URL放入待抓取URL队列中,爬虫从待抓取URL队列依次读取,并将URL通过DNS解析,把链接地址转换为网站服务器对应的IP地址。

爬虫又分为批量型爬虫(Batch Crawler),增量型爬虫(Incremental Crawler),

增量型爬虫(Incremental Crawler)。

这是一篇来自Google站长论坛John Mu的文章:

一般来说,我们(Google)的搜索引擎爬虫是不能够百分百地从语法层面去精确地描述或者分析HTML中的标签的,新兴的HTML5也不例外。如果HTML5组织的网站越来越多,并且在实际当中给我们的爬虫抓取信息带来方便与效益的话,我们会尽力将完善我们的算法去迎合HTML5的标签特性。要记住的是,我没有明确地支持你们大家都用HTML5来构建网站,并且我没有明确提出希望大家的网站由于用HTML5来构建而在搜索当中获得很好的对待。HTML5仍然有许多地方需要不断完善,而如果大网站致力于运用HTML5的话将是令人振奋的事。

对于HTML5,我觉得它仍没有得到广泛的推广与应用,因此我们暂时不会将焦点放到它上面,我们不肯定使用HTML5构建的网站比用旧版本的HTML构建的网站在搜索中是否表现出优势。

从上面可以看出google搜索引擎更倾向与html5的一些独特的标签,例如section,article,aside,nav的合理分布,更让倾向于引擎的搜索识别抓取。从下图可以看出。

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: