python中从字符串中截取中文和英文字符
2016-09-20 11:55
951 查看
# -*- coding: utf-8 -*- #encoding=utf8 import os,sys,re # # test_str1='蒙派克E' # # test_str2='新ABC蒙派克' # # test_s1 = test_str1.decode('utf-8') # test_s2= test_str2.decode('utf-8') # # pat_1 = re.compile(ur'[\u4e00-\u9fa5]') #这里是关键, # # s1_zhongwen='' # # s2_zhongwen='' # # for item in re.findall(pat_1,test_s1): #这里截取出中文字符 # # print item # s1_zhongwen=s1_zhongwen+item # print s1_zhongwen # # for item in re.findall(pat_1,test_s2): # s2_zhongwen=s2_zhongwen+item # print s2_zhongwen # # for item in (set(s1_zhongwen)-set(s2_zhongwen))|(set(s2_zhongwen)-set(s1_zhongwen)): # print item #计算到两个车型的中文名称的重叠度。 # print pat_1.split(test_s2)#这里截取出非中文的字符 以及,快速的把字符串,变成各个单个字符元素组成的集合的方法
# tl1=[1,3,5,'abc'] # # tl2=[3,4,5] # # tl3=[5,9] # # # # test_set=set(tl1) | set(tl2) | set(tl3) #
相关文章推荐
- 写了一个字符串截取一定长度的代码,中文两个字符,英文一个字符,如果截断了自动用一个.或两个.来对齐,用于标题的显示
- python删除所有的中文字符、非ASCII或非英文字符,检查字符串是否包含非ASCII
- 截取字符串,中文一个字算一个字,英文两个字符算一个字
- C#、Java实现按字节截取字符串包含中文汉字和英文字符数字标点符号等
- (Delphi中处理字符串)截取中文字符和英文字符,去除所有数字
- 字符串长度及截取(中文2字符,英文1字符)
- 获取包含中文,字母,数字集合的字符串的长度(1个汉字字符存储需要2个字节,1个英文字符存储需要1个字节)
- C# 字符、字符串过滤,只能输入数字、中文、英文、大写、小写(转)
- SQL 字符串截取左边指定长度字符串中文、英文
- 读取中文字符串长度 AND 按长度截取中文字符串中字符
- 用Python将字符串里的英文双引号转换成中文双引号
- 截取指定的字符长度(其中字符串中有中文,如果有半个中文则去掉)
- 用JavaScript截取一定长度字符串(中文长度为2,英文长度为1)
- ASP截取字符串左边的限定长度(区别英文和中文)
- 给定一个字符串,包含中文字符和英文字符,取给定大小字节的子串。
- c++一次输出单个中文字符和英文字符串
- 设计函数,输入为一个字符串,里边包含中文、英文、数字等字符,编码为GBK。中文字符的编码规则假定为:双字节组成,高字节大于0x80,低字节任意。
- 【转】SQL函数:字符串中提取数字,英文,中文,过滤重复字符
- 中英文 字符 截取 判断 中文 英文
- SQL函数:字符串中提取数字,英文,中文,过滤重复字符