您的位置：首页 > 其它

转载一段来自知乎的回答

2016-04-18 00:20 274 查看

作者：貘吃馍香

链接：https://www.zhihu.com/question/20027966/answer/13727477

来源：知乎

著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。

基于规则 %html.content "HEAD|BODY" HTML 标签的子元素只能是 HEAD BODY。

但是浏览器对HTML(XHTML)均有容错机制。错误嵌套的标签、以及位置放置错误的标签都会在paser HTML 过程中尝试修复。修复后得到合法的HTML后在由布局引擎建立相应的DOM对象。

在<script>标签放置于</body>标签之后时，源码被所有浏览器【泛指PC上常见的】修复为正常形式，即<script></script></body>。

由此，Google 这种利用基于浏览器修复【或规范中可以不闭合标签条款的】机制，处理是可以的。它的意图是尽可能少输出内容，由客户端浏览器来辅助它处理HTML，最终目的是为了提速与尽可能加大服务端吞吐量。

至于新浪微博的问题，比较复杂，只能推测下。

新浪微博默认采用【非IE6下】bigpipe机制分块输出页面内容。这需要在首块时候就吐出页面框架结构给浏览器。那么这个先吐出的页面结构是否需要闭合</body>标签呢？

从直觉触发，为了避免浏览器出现未知异常，应该在首次吐出的页面框架中闭合body。那么，之后分块输出的 script 标签必然会被打印在 </body>之后，然后依赖浏览器修复机制执行代码。

新浪微博当时的工程师们可能并不知道修复机制，仅仅是为了避免项目风险，经过测试后发现这么做可行，就这么做了。

不管怎样，基于bigpipe机制分块吐出机制，在body没有闭合，页面数据继续到达的情况下，之后被吐出的script代码很可能存在操作document.body对象，这样可能会导致异常，你我做如此实现时候都必须掂量下是否要冒风险不闭合body标签。

此外，对于贺老祖的一些解释，偶表示部分不认同。

content type 的问题。

rfc3236 规定了 application/xhtml+xml 这样的 XHTML mimetype 来表示一个XHTML文件。但是浏览器并不一定按照这个 mimetype 来解析，偶从开源浏览器代码中【Gecko/Webkit】只看到 parser HTML 部分的实现，这部分内容对于 XHTML 是无特殊处理的，就是说即使是 XHTML 也会被当做 HTML parser。唯一有一点不同的是，页面的 DTD 如何写会被浏览器嗅探，用来触发三种不同的文档模式【怪异、近乎标准、标准】。至于当前文档的 mimetype
是什么，对解析 HTML 或者渲染的影响，没有得到很明显的源码证据。

【当然，基于network层是会区分mimetype 的，它会筛选出它认为是HTML的类型交付HTML parse 处理。事实上IE会比其他浏览器做的要更多，对于非二进制类型，会启用“HTML嗅探机制”，如果首200字符内有特定HTML标记，则会将文档交由HTML parse 处理】。

贺老祖【】内表述的挂羊头卖狗肉行为偶就不细说了，仅当做贺老祖个人情绪发泄。个人感觉没必要太学院了，实际适用就好。

恩恩，惯例，最后来个总结。

说了这么多，两种方式实际使用上没有什么区别，唯一差异在于你是否要利用浏览器的自动修复机制。

当然，理论上讲，利用了自动修复机制必然会导致性能有损失。

至于性能损失多大，是否要如此用，偶说不好，由看官自行判断。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航