您的位置:首页 > 编程语言 > PHP开发

PHP中utf-8编码格式之BOM引发的问题

2009-10-10 11:34 369 查看
一个很常见的错误:在使用setcookie()
时经常会遇到的,就是cannot modify header
information


- headers already sent by....
错误,可是确实没有在setcookie前输出任何内容,如果你使用的是UTF-8编码,那么这个错误的原因多半就是因为编码了,因为PHP4,5都不能识别UTF-8编码中的BOM,所以你一定要把文件保存成无BOM格式(可以使用notepad++等工具转换一下)。

那么BOM到底是何方神圣呢?要他有什么用?

Unicode

规范中有一个
BOM

的概念。
BOM

——
Byte Order Mark

,就是字节序标记。在这里找到一段关于
BOM

的说明:


UCS

编码中有一个叫做
"ZERO WIDTH NO-BREAK SPACE"

的字符,它的编码是
FEFF

。而
FFFE


UCS

中是不存在的字符,所以不应该出现在实际传输中。
UCS

规范建议我们在传输字节流前,先传输字符
"ZERO WIDTH NO-BREAK SPACE"

。这样如果接收者收到
FEFF

,就表明这个字节流是
Big-Endian

的;如果收到
FFFE

,就表明这个字节流是
Little-Endian

的。因此字符
"ZERO WIDTH NO-BREAK SPACE"

又被称作
BOM



U
TF-8不需要BOM来表明字节顺序,但可以用BOM来表明编码方式。字符"ZERO WIDTH NO-BREAK SPACE"的UTF-8编码是EF BB BF。所以如果接收者收到以EF BB BF开头的字节流,就知道这是UTF-8编码了。

问题是,BOM虽然在编辑器中不显示,但是会产生输出,这就是

headers already sent by....
产生的原因了。

可是不用BOM又有一些问题,因为某些比较老的浏览器(如IE6)如果没有BOM他又识别不了,会产生明明有内容页面却一片空白的问题,我的解决办法是将setcookie()
等需要在输出前调用的函数及调用这个函数之前的所有代码放在一个外部文件中,保存为无BOM格式,而网页的主体保存为正常格式,并在第一行引用这个外部文件,这样就解决了这个问题。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: