您的位置:首页 > 编程语言 > Python开发

Python 3 正则表达式对中文的匹配

2016-05-16 23:58 471 查看
import re

s='中文匹配7.14 3000 '.encode('utf-8')
s=s.decode('utf8')
m =re.findall(u"[\u4e00-\u9fa5]+",s)
print(m)


搜了半天网上的都是Python2的代码,根本不能运行,浪费半天时间,

[\u4e00-\u9fa5]+
中文正则表达式

看了出错cannot use a string pattern on a bytes-like object

原来类型str和byte不是同一类型无法匹配

稍微改了一下2次编码整成同一类型,成功匹配。

转码带u的字符

s.decode(
'unicode_escape'
)
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: