您的位置:首页 > 编程语言 > Python开发

paip.utf-8,unicode编码的本质输出unicode文件原理 python

2014-04-28 00:16 459 查看
paip.utf-8,unicode编码的本质输出unicode文件原理 python

#别的语言,java php都是unicode,走十python不一样.

#enddef

#todo write to unicode encode

fileHandle = open ( r"c:\fmtSmpEnRst.txt", 'w',encoding="UTF-16" )

#todox utf8 not decode...now UTF-16是Unicode

lines=file2list(f, encode="utf-16")

作者 老哇的爪子 Attilax 艾龙, EMAIL:1466519819@qq.com

转载请注明来源: http://blog.csdn.net/attilax
#原理

一般所谓的unicode 其实是utf-16,双字节或者4字节。

utf-8是多字节。

真正的unicode其实只是对文字的一个唯一编码,utf-8,utf-16都是这个编码到文件的一种实现方式。

,unicode和gbk是编码的值,而utf-8和utf-16是编码的表现形式

是的,unicode准确说是一个字符编码表,而utf-32,utf-16,utf-8是unicode这个字符编码表的传输方式。比如 UTF-8

所以,甚至可以把utf-8,unicode,gbk理解成不同的编码,中间通过unicode转换,呵呵。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: