python中文处理
2007-07-11 15:30
316 查看
python中文处理好方法
(转载URL:http://www.pythonid.com/bbs/viewthread.php?tid=20&extra=page%3D1)
用python处理字符串很容易,但是在处理中文的时候需要注意一些问题。
比如:
a = "我们是python爱好者"
print a[0]
只能输出“我”字的前半部分,要想输出整个的我字还需要
b = a[0:2]
print b
才行,很不方便,并且当一段文本中同时有中英文的时候很难处理。
最好的办法就是转换为unicode。
像这样:
c = unicode(a, "gb2312")
print c[0]
这个时候c的下标对应的就是每一字,不再是字节,并且通过 len(c) 就可以获得字数!
还可以很方便的转换为其他编码,比如转换为 utf-8
d = c.encode("utf-8")
(转载URL:http://www.pythonid.com/bbs/viewthread.php?tid=20&extra=page%3D1)
用python处理字符串很容易,但是在处理中文的时候需要注意一些问题。
比如:
a = "我们是python爱好者"
print a[0]
只能输出“我”字的前半部分,要想输出整个的我字还需要
b = a[0:2]
print b
才行,很不方便,并且当一段文本中同时有中英文的时候很难处理。
最好的办法就是转换为unicode。
像这样:
c = unicode(a, "gb2312")
print c[0]
这个时候c的下标对应的就是每一字,不再是字节,并且通过 len(c) 就可以获得字数!
还可以很方便的转换为其他编码,比如转换为 utf-8
d = c.encode("utf-8")
相关文章推荐
- Python CGi URL 中文以及特殊转义字符的处理
- python的elementtree模块处理中文注意事项
- Python:中文处理攻略
- python处理中文字符串
- python中文处理
- python解决处理中文的问题
- python3访问sina首页中文的处理方法
- python3访问sina首页中文的处理方法
- Python-中文编码处理小结
- 通过读写文本文件小结“关于python处理中文编码的问题”
- 【转】Python urllib2.urlopen打开中文url的编码处理
- Unicode和Python的中文处理
- python 处理中文Excel
- python处理中文字符串的问题
- python中文处理
- 小结Python的中文处理 [
- python处理中文编码
- python 中文编码处理与文件读写
- 在Python中处理中文路径
- python源码中中文注释的处理