python 过滤四字节字符 表情字符
2014-12-06 22:43
387 查看
项目中有时需要过滤掉四字节以上的字符(表情),比如mysql数据库5.5.3以下的版本text字段不支持四字节以上字符
于是就需要过滤掉再入库,python中的方法为:
于是就需要过滤掉再入库,python中的方法为:
try: # python UCS-4 build的处理方式 highpoints = re.compile(u'[\U00010000-\U0010ffff]') except re.error: # python UCS-2 build的处理方式 highpoints = re.compile(u'[\uD800-\uDBFF][\uDC00-\uDFFF]') resovle_value = highpoints.sub(u'??', src_string)
相关文章推荐
- 【Python】 过滤 微博 四字节表情
- python 正则过滤四字节字符
- 关于字符 字节 python3
- 过滤字符串中的多字节字符
- python中文utf8编码后是占3个字符,unicode汉字为2字节
- Python连接MySQL并使用fetchall()方法过滤特殊字符
- 过滤utf8 字符中超过三个字节的字符,或者非utf8字符
- python这门功夫厉害归厉害,却也够邪气的(对双字节字符支持不是很好)
- python emoji 表情过滤
- python过滤字符串中不属于指定集合中字符的类实例
- python 表情过滤
- iOStextfield 限制输入字符长度和过滤表情符号
- 黄聪:解决python中文处理乱码,先要弄懂“字符”和“字节”的差别
- 用php过滤文字中的表情字符
- 用php过滤文字中的表情字符
- python过滤字符串中不属于指定集合中字符的类实例
- 【python cookbook】python过滤字符串中不属于指定集合的字符
- 解决python中文处理乱码,先要弄懂“字符”和“字节”的差别
- 过滤utf8 字符中超过三个字节的字符,或者非utf8字符