python中文处理好方法
2011-11-18 17:05
477 查看
用python处理字符串很容易,但是在处理中文的时候需要注意一些问题。
比如:
a = "我们是python爱好者"
print a[0]
只能输出“我”字的前半部分,要想输出整个的我字还需要
b = a[0:2]
print b
才行,很不方便,并且当一段文本中同时有中英文?氖焙蚝苣汛怼?
最好的办法就是转换为unicode。
像这样:
c = unicode(a, "gb2312")
print c[0]
这个时候c的下标对应的就是每一字,不再是字节,并且通过 len(c) 就可以获得字数!
还可以很方便的转换为其他编码,比如转换为 utf-8
d = c.encode("utf-8")
比如:
a = "我们是python爱好者"
print a[0]
只能输出“我”字的前半部分,要想输出整个的我字还需要
b = a[0:2]
print b
才行,很不方便,并且当一段文本中同时有中英文?氖焙蚝苣汛怼?
最好的办法就是转换为unicode。
像这样:
c = unicode(a, "gb2312")
print c[0]
这个时候c的下标对应的就是每一字,不再是字节,并且通过 len(c) 就可以获得字数!
还可以很方便的转换为其他编码,比如转换为 utf-8
d = c.encode("utf-8")
相关文章推荐
- python 字典中文key处理,读取,比较方法
- python中读写文件及中文编码处理方法
- 基于python 处理中文路径的终极解决方法
- python3访问sina首页中文的处理方法
- Python requests库解析中文网页乱码处理方法
- Python中文路径及"ValueError: invalid \x escape"的处理方法
- 【随笔记录】python 处理中文时出现的错误'ascii' codec can't decode byte 0xe9 in position 0: ordinal not in range(128)" 解决方法
- python 处理中文时出现的错误'ascii' codec can't decode byte 0xe9 in position 0: ordinal not in range(128)" 解决方法
- python中读写文件及中文编码处理方法【整理】
- Python中文路径及"ValueError: invalid \x escape"的处理方法
- Python点滴02_Python3打开中文文本时报错的一种处理方法
- sqlite3 jdbc、c接口、python接口处理中文时遇到的问题及其解决方法
- python 处理中文时出现的错误'ascii' codec can't decode byte 0xe9 in position 0: ordinal not in range(128)" 解决方法
- 中文编码相关,python处理gbk编码的xml文件方法
- Python3 URLopen 含中文URL的处理方法
- python中文处理好方法
- python3处理含有中文的url方法
- sqlite3 jdbc、c接口、python接口处理中文时遇到的问题及其解决方法
- python 处理中文时出现的错误'ascii' codec can't decode byte 0xe9 in position 0: ordinal not in range(128)" 解决方法
- python处理csv文件名中中文字符解决方法