您的位置:首页 > 业界新闻

What the hell is "锟斤拷"?

2008-12-02 21:30 211 查看
在win下面ssh到一台UTF8的FREEBSD上,如果不调PUTTY的编码,就老是看到"锟斤拷"

锟斤拷是一种计算机软件系统内部错误编码导致的文字不正常显示的现象。

Unicode标准中定义了一个Replacement Character,标记为U+FFFD,作用为:
A character used as a substitute for an uninterpretable character from
another encoding. The Unicode Standard uses U+FFFD replacement
character for this function.

U+FFFD的UTF-8编码结果为“EF BF BD”。如果有一大段文字都是采用了“U+FFFD U+FFFD”作为占位符的话,那么这段字符的UTF-8流十六进制格式为“EF BF BD EF BF BD...”。

如果错误的放置于GB2312/GBK/CP936编码环境里显示的话,最终字符为锟斤拷,他们分别是锟(0xEFBF),斤(0xBDEF),拷(0xBFBD)。由于Web大量采用Gb2312和UTF-8混合编码,该现象在互联网十分普遍。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息