您的位置:首页 > 移动开发 > IOS开发

iOS开发探索-正则表达式

2016-02-19 00:00 627 查看


概念

正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。


给定一个正则表达式和另一个字符串,我们可以达到如下的目的:



给定的字符串是否符合正则表达式的过滤逻辑(称作“匹配”);



可以通过正则表达式,从字符串中获取我们想要的特定部分。



正则表达式的特点是:



灵活性、逻辑性和功能性非常的强;



可以迅速地用极简单的方式达到字符串的复杂控制。



对于刚接触的人来说,比较晦涩难懂。



正则表达式的应用:


正则表达式是一种用来进行文本匹配的工具,其语法优美简洁。在开发中,查找、对比以及匹配字符串是家常便饭的业务,通过正则表达式我们将这些业务描述成某些需求规则,来让我们的代码更美观、实用。


使用步骤


1.定义正则表达式规则

2.通过规则,创建正则表达式对象

3.利用正则表达式对象匹配字符串

注意:正则表达式通常缩写成“regex”


正则表达式常见的语义语法

/**
* 正则表达式简单说明
* 语法:
. 匹配除换行符以外的任意字符 \\w 匹配字母或数字或下划线或汉字 \\s 匹配任意的空白符 \\d 匹配数字 \\b 匹配单词的开始或结束
^ 匹配字符串的开始 $ 匹配字符串的结束
* 重复零次或更多次
+ 重复一次或更多次
? 重复零次或一次 {n} 重复n次 {n,} 重复n次或更多次 {n,m} 重复n到m次 \\W 匹配任意不是字母,数字,下划线,汉字的字符 \\S 匹配任意不是空白符的字符 \\D 匹配任意非数字的字符 \\B 匹配不是单词开头或结束的位置 [^x] 匹配除了x以外的任意字符 [^aeiou]匹配除了aeiou这几个字母以外的任意字符
*? 重复任意次,但尽可能少重复
+? 重复1次或更多次,但尽可能少重复
?? 重复0次或1次,但尽可能少重复 {n,m}? 重复n到m次,但尽可能少重复 {n,}? 重复n次以上,但尽可能少重复 \\a 报警字符(打印它的效果是电脑嘀一声) \\b 通常是单词分界位置,但如果在字符类里使用代表退格 \\t 制表符,Tab \\r 回车 \\v 竖向制表符 \\f 换页符 \\n 换行符 \\e Escape \\0nn ASCII代码中八进制代码为nn的字符 \\xnn ASCII代码中十六进制代码为nn的字符 \\unnnn Unicode代码中十六进制代码为nnnn的字符 \\cN ASCII控制字符。比如\\cC代表Ctrl+C \\A 字符串开头(类似^,但不受处理多行选项的影响) \\Z 字符串结尾或行尾(不受处理多行选项的影响) \\z 字符串结尾(类似$,但不受处理多行选项的影响) \\G 当前搜索的开头 \\p{name} Unicode中命名为name的字符类,例如\\p{IsGreek} (?>exp) 贪婪子表达式
(?<x>-<y>exp) 平衡组
(?im-nsx:exp) 在子表达式exp中改变处理选项
(?im-nsx) 为表达式后面的部分改变处理选项
(?(exp)yes|no) 把exp当作零宽正向先行断言,如果在这个位置能匹配,使用yes作为此组的表达式;否则使用no
(?(exp)yes) 同上,只是使用空表达式作为no
(?(name)yes|no) 如果命名为name的组捕获到了内容,使用yes作为表达式;否则使用no
(?(name)yes) 同上,只是使用空表达式作为no

捕获
(exp) 匹配exp,并捕获文本到自动命名的组里
(?<name>exp) 匹配exp,并捕获文本到名称为name的组里,也可以写成 (?'name'exp)
(?:exp) 匹配exp,不捕获匹配的文本,也不给此分组分配组号
零宽断言
(?=exp) 匹配exp前面的位置
(?<=exp) 匹配exp后面的位置
(?!exp) 匹配后面跟的不是exp的位置
(?<!exp) 匹配前面不是exp的位置
注释
(?#comment) 这种类型的分组不对正则表达式的处理产生任何影响,用于提供注释让人阅读

* 表达式:\\(?0\\d{2}[) -]?\\d{8} * 这个表达式可以匹配几种格式的电话号码,像(010)88886666,或022-22334455,或02912345678等。
* 我们对它进行一些分析吧:
* 首先是一个转义字符\\(,它能出现0次或1次(?),然后是一个0,后面跟着2个数字(\\d{2}),然后是)或-或空格中的一个,它出现1次或不出现(?),
* 最后是8个数字(\\d{8})
*/

以下为通过一个分类将常用到的一些正则表达是进行归类



NSString+RegexCategory.h


#import <Foundation/Foundation.h> @interface NSString (RegexCategory) /**
* 手机号码的有效性:分电信、联通、移动和小灵通
*/ - (BOOL)isMobileNumberClassification; /**
* 手机号有效性
*/ - (BOOL)isMobileNumber; /**
* 邮箱的有效性
*/ - (BOOL)isEmailAddress; /**
* 简单的***有效性
*
*/ - (BOOL)simpleVerifyIdentityCardNum; /**
* 精确的***号码有效性检测
*
* @param value ***号
*/ + (BOOL)accurateVerifyIDCardNumber:(NSString *)value; /**
* 车牌号的有效性
*/ - (BOOL)isCarNumber; /**
* 银行卡的有效性
*/ - (BOOL)bankCardluhmCheck; /**
* IP地址有效性
*/ - (BOOL)isIPAddress; /**
* Mac地址有效性
*/ - (BOOL)isMacAddress; /**
* 网址有效性
*/ - (BOOL)isValidUrl; /**
* 纯汉字
*/ - (BOOL)isValidChinese; /**
* 邮政编码
*/ - (BOOL)isValidPostalcode; /**
* 工商税号
*/ - (BOOL)isValidTaxNo; /**
@brief 是否符合最小长度、最长长度,是否包含中文,首字母是否可以为数字
@param minLenth 账号最小长度
@param maxLenth 账号最长长度
@param containChinese 是否包含中文
@param firstCannotBeDigtal 首字母不能为数字
@return 正则验证成功返回YES, 否则返回NO
*/ - (BOOL)isValidWithMinLenth:(NSInteger)minLenth
maxLenth:(NSInteger)maxLenth
containChinese:(BOOL)containChinese
firstCannotBeDigtal:(BOOL)firstCannotBeDigtal; /**
@brief 是否符合最小长度、最长长度,是否包含中文,数字,字母,其他字符,首字母是否可以为数字
@param minLenth 账号最小长度
@param maxLenth 账号最长长度
@param containChinese 是否包含中文
@param containDigtal 包含数字
@param containLetter 包含字母
@param containOtherCharacter 其他字符
@param firstCannotBeDigtal 首字母不能为数字
@return 正则验证成功返回YES, 否则返回NO
*/ - (BOOL)isValidWithMinLenth:(NSInteger)minLenth
maxLenth:(NSInteger)maxLenth
containChinese:(BOOL)containChinese
containDigtal:(BOOL)containDigtal
containLetter:(BOOL)containLetter
containOtherCharacter:(NSString *)containOtherCharacter
firstCannotBeDigtal:(BOOL)firstCannotBeDigtal; @end


NSString+RegexCategory.m


#import "NSString+RegexCategory.h" @implementation NSString (RegexCategory) #pragma mark - 正则相关 - (BOOL)isValidateByRegex:(NSString *)regex
{ NSPredicate *pre = [NSPredicate predicateWithFormat:@"SELF MATCHES %@",regex]; return [pre evaluateWithObject:self];
} #pragma mark - //手机号分服务商 - (BOOL)isMobileNumberClassification{ /**
* 手机号码
* 移动:134[0-8],135,136,137,138,139,150,151,157,158,159,182,187,188,1705
* 联通:130,131,132,152,155,156,185,186,1709
* 电信:133,1349,153,180,189,1700
*/ // NSString * MOBILE = @"^1((3//d|5[0-35-9]|8[025-9])//d|70[059])\\\\d{7}$";//总况 /**
10 * 中国移动:China Mobile
11 * 134[0-8],135,136,137,138,139,150,151,157,158,159,182,187,188,1705
12 */ NSString * CM = @"^1(34[0-8]|(3[5-9]|5[017-9]|8[278])\\\\d|705)\\\\d{7}$"; /**
15 * 中国联通:China Unicom
16 * 130,131,132,152,155,156,185,186,1709
17 */ NSString * CU = @"^1((3[0-2]|5[256]|8[56])\\\\d|709)\\\\d{7}$"; /**
20 * 中国电信:China Telecom
21 * 133,1349,153,180,189,1700
22 */ NSString * CT = @"^1((33|53|8[09])\\\\d|349|700)\\\\d{7}$"; /**
25 * 大陆地区固话及小灵通
26 * 区号:010,020,021,022,023,024,025,027,028,029
27 * 号码:七位或八位
28 */ NSString * PHS = @"^0(10|2[0-5789]|\\\\d{3})\\\\d{7,8}$"; // NSPredicate *regextestmobile = [NSPredicate predicateWithFormat:@"SELF MATCHES %@", MOBILE]; if (([self isValidateByRegex:CM])
|| ([self isValidateByRegex:CU])
|| ([self isValidateByRegex:CT])
|| ([self isValidateByRegex:PHS]))
{ return YES;
} else { return NO;
}
} //手机号有效性 - (BOOL)isMobileNumber{ /**
* 手机号以13、15、18、170开头,8个 \\d 数字字符
* 小灵通 区号:010,020,021,022,023,024,025,027,028,029 还有未设置的新区号xxx
*/ NSString *mobileNoRegex = @"^1((3\\\\d|5[0-35-9]|8[025-9])\\\\d|70[059])\\\\d{7}$";//除4以外的所有个位整数,不能使用[^4,\\\\d]匹配,这里是否iOS Bug? NSString *phsRegex =@"^0(10|2[0-57-9]|\\\\d{3})\\\\d{7,8}$"; BOOL ret = [self isValidateByRegex:mobileNoRegex]; BOOL ret1 = [self isValidateByRegex:phsRegex]; return (ret || ret1);
} //邮箱 - (BOOL)isEmailAddress{ NSString *emailRegex = @"[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\\\\.[A-Za-z]{2,4}"; return [self isValidateByRegex:emailRegex];
} //***号 - (BOOL) simpleVerifyIdentityCardNum
{ NSString *regex2 = @"^(\\\\d{14}|\\\\d{17})(\\\\d|[xX])$"; return [self isValidateByRegex:regex2];
} //车牌 - (BOOL)isCarNumber{ //车牌号:湘K-DE829 香港车牌号码:粤Z-J499港 NSString *carRegex = @"^[\\u4e00-\\u9fff]{1}[a-zA-Z]{1}[-][a-zA-Z_0-9]{4}[a-zA-Z_0-9_\\u4e00-\\u9fff]$";//其中\\u4e00-\\u9fa5表示unicode编码中汉字已编码部分,\\u9fa5-\\u9fff是保留部分,将来可能会添加 return [self isValidateByRegex:carRegex];
}

- (BOOL)isMacAddress{ NSString * macAddRegex = @"([A-Fa-f\\\\d]{2}:){5}[A-Fa-f\\\\d]{2}"; return [self isValidateByRegex:macAddRegex];
}

- (BOOL)isValidUrl
{ NSString *regex = @"^((http)|(https))+:[^\\\\s]+\\\\.[^\\\\s]*$"; return [self isValidateByRegex:regex];
}

- (BOOL)isValidChinese;
{ NSString *chineseRegex = @"^[\\u4e00-\\u9fa5]+$"; return [self isValidateByRegex:chineseRegex];
}

- (BOOL)isValidPostalcode { NSString *postalRegex = @"^[0-8]\\\\d{5}(?!\\\\d)$"; return [self isValidateByRegex:postalRegex];
}

- (BOOL)isValidTaxNo
{ NSString *taxNoRegex = @"[0-9]\\\\d{13}([0-9]|X)$"; return [self isValidateByRegex:taxNoRegex];
}

- (BOOL)isValidWithMinLenth:(NSInteger)minLenth
maxLenth:(NSInteger)maxLenth
containChinese:(BOOL)containChinese
firstCannotBeDigtal:(BOOL)firstCannotBeDigtal;
{ // [\\u4e00-\\u9fa5A-Za-z0-9_]{4,20} NSString *hanzi = containChinese ? @"\\u4e00-\\u9fa5" : @""; NSString *first = firstCannotBeDigtal ? @"^[a-zA-Z_]" : @""; NSString *regex = [NSString stringWithFormat:@"%@[%@A-Za-z0-9_]{%d,%d}", first, hanzi, (int)(minLenth-1), (int)(maxLenth-1)]; return [self isValidateByRegex:regex];
}

- (BOOL)isValidWithMinLenth:(NSInteger)minLenth
maxLenth:(NSInteger)maxLenth
containChinese:(BOOL)containChinese
containDigtal:(BOOL)containDigtal
containLetter:(BOOL)containLetter
containOtherCharacter:(NSString *)containOtherCharacter
firstCannotBeDigtal:(BOOL)firstCannotBeDigtal;
{ NSString *hanzi = containChinese ? @"\\u4e00-\\u9fa5" : @""; NSString *first = firstCannotBeDigtal ? @"^[a-zA-Z_]" : @""; NSString *lengthRegex = [NSString stringWithFormat:@"(?=^.{%@,%@}$)", @(minLenth), @(maxLenth)]; NSString *digtalRegex = containDigtal ? @"(?=(.*\\\\d.*){1})" : @""; NSString *letterRegex = containLetter ? @"(?=(.*[a-zA-Z].*){1})" : @""; NSString *characterRegex = [NSString stringWithFormat:@"(?:%@[%@A-Za-z0-9%@]+)", first, hanzi, containOtherCharacter ? containOtherCharacter : @""]; NSString *regex = [NSString stringWithFormat:@"%@%@%@%@", lengthRegex, digtalRegex, letterRegex, characterRegex]; return [self isValidateByRegex:regex];
} #pragma mark - 算法相关 //精确的***号码有效性检测 + (BOOL)accurateVerifyIDCardNumber:(NSString *)value {
value = [value stringByTrimmingCharactersInSet:[NSCharacterSet whitespaceAndNewlineCharacterSet]]; int length =0; if (!value) { return NO;
}else {
length = (int)value.length; if (length !=15 && length !=18) { return NO;
}
} // 省份代码 NSArray *areasArray =@[@"11",@"12", @"13",@"14", @"15",@"21", @"22",@"23", @"31",@"32", @"33",@"34", @"35",@"36", @"37",@"41", @"42",@"43", @"44",@"45", @"46",@"50", @"51",@"52", @"53",@"54", @"61",@"62", @"63",@"64", @"65",@"71", @"81",@"82", @"91"]; NSString *valueStart2 = [value substringToIndex:2]; BOOL areaFlag =NO; for (NSString *areaCode in areasArray) { if ([areaCode isEqualToString:valueStart2]) {
areaFlag =YES; break;
}
} if (!areaFlag) { return false;
} NSRegularExpression *regularExpression; NSUInteger numberofMatch; int year =0; switch (length) { case 15:
year = [value substringWithRange:NSMakeRange(6,2)].intValue +1900; if (year %4 ==0 || (year %100 ==0 && year %4 ==0)) {

regularExpression = [[NSRegularExpression alloc] initWithPattern:@"^[1-9][0-9]{5}[0-9]{2}((01|03|05|07|08|10|12)(0[1-9]|[1-2][0-9]|3[0-1])|(04|06|09|11)(0[1-9]|[1-2][0-9]|30)|02(0[1-9]|[1-2][0-9]))[0-9]{3}$" options:NSRegularExpressionCaseInsensitive error:nil];//测试出生日期的合法性 }else {
regularExpression = [[NSRegularExpression alloc]initWithPattern:@"^[1-9][0-9]{5}[0-9]{2}((01|03|05|07|08|10|12)(0[1-9]|[1-2][0-9]|3[0-1])|(04|06|09|11)(0[1-9]|[1-2][0-9]|30)|02(0[1-9]|1[0-9]|2[0-8]))[0-9]{3}$" options:NSRegularExpressionCaseInsensitive error:nil];//测试出生日期的合法性 }
numberofMatch = [regularExpression numberOfMatchesInString:value
options:NSMatchingReportProgress range:NSMakeRange(0, value.length)]; if(numberofMatch >0) { return YES;
}else { return NO;
} case 18:
year = [value substringWithRange:NSMakeRange(6,4)].intValue; if (year %4 ==0 || (year %100 ==0 && year %4 ==0)) {

regularExpression = [[NSRegularExpression alloc] initWithPattern:@"^[1-9][0-9]{5}19[0-9]{2}((01|03|05|07|08|10|12)(0[1-9]|[1-2][0-9]|3[0-1])|(04|06|09|11)(0[1-9]|[1-2][0-9]|30)|02(0[1-9]|[1-2][0-9]))[0-9]{3}[0-9Xx]$" options:NSRegularExpressionCaseInsensitive error:nil];//测试出生日期的合法性 }else {
regularExpression = [[NSRegularExpression alloc] initWithPattern:@"^[1-9][0-9]{5}19[0-9]{2}((01|03|05|07|08|10|12)(0[1-9]|[1-2][0-9]|3[0-1])|(04|06|09|11)(0[1-9]|[1-2][0-9]|30)|02(0[1-9]|1[0-9]|2[0-8]))[0-9]{3}[0-9Xx]$" options:NSRegularExpressionCaseInsensitive error:nil];//测试出生日期的合法性 }
numberofMatch = [regularExpression numberOfMatchesInString:value
options:NSMatchingReportProgress range:NSMakeRange(0, value.length)]; if(numberofMatch >0) { int S = ([value substringWithRange:NSMakeRange(0,1)].intValue + [value substringWithRange:NSMakeRange(10,1)].intValue) *7 + ([value substringWithRange:NSMakeRange(1,1)].intValue + [value substringWithRange:NSMakeRange(11,1)].intValue) *9 + ([value substringWithRange:NSMakeRange(2,1)].intValue + [value substringWithRange:NSMakeRange(12,1)].intValue) *10 + ([value substringWithRange:NSMakeRange(3,1)].intValue + [value substringWithRange:NSMakeRange(13,1)].intValue) *5 + ([value substringWithRange:NSMakeRange(4,1)].intValue + [value substringWithRange:NSMakeRange(14,1)].intValue) *8 + ([value substringWithRange:NSMakeRange(5,1)].intValue + [value substringWithRange:NSMakeRange(15,1)].intValue) *4 + ([value substringWithRange:NSMakeRange(6,1)].intValue + [value substringWithRange:NSMakeRange(16,1)].intValue) *2 + [value substringWithRange:NSMakeRange(7,1)].intValue *1 + [value substringWithRange:NSMakeRange(8,1)].intValue *6 + [value substringWithRange:NSMakeRange(9,1)].intValue *3; int Y = S %11; NSString *M =@"F"; NSString *JYM =@"10X98765432";
M = [JYM substringWithRange:NSMakeRange(Y,1)];// 判断校验位 if ([M isEqualToString:[value substringWithRange:NSMakeRange(17,1)]]) { return YES;// 检测ID的校验位 }else { return NO;
}

}else { return NO;
} default: return NO;
}
} /** 银行卡号有效性问题Luhn算法
* 现行 16 位银联卡现行卡号开头 6 位是 622126~622925 之间的,7 到 15 位是银行自定义的,
* 可能是发卡分行,发卡网点,发卡序号,第 16 位是校验码。
* 16 位卡号校验位采用 Luhm 校验方法计算:
* 1,将未带校验位的 15 位卡号从右依次编号 1 到 15,位于奇数位号上的数字乘以 2
* 2,将奇位乘积的个十位全部相加,再加上所有偶数位上的数字
* 3,将加法和加上校验位能被 10 整除。
*/ - (BOOL)bankCardluhmCheck{ NSString * lastNum = [[self substringFromIndex:(self.length-1)] copy];//取出最后一位 NSString * forwardNum = [[self substringToIndex:(self.length -1)] copy];//前15或18位 NSMutableArray * forwardArr = [[NSMutableArray alloc] initWithCapacity:0]; for (int i=0; i<forwardNum.length; i++) { NSString * subStr = [forwardNum substringWithRange:NSMakeRange(i, 1)];
[forwardArr addObject:subStr];
} NSMutableArray * forwardDescArr = [[NSMutableArray alloc] initWithCapacity:0]; for (int i = (int)(forwardArr.count-1); i> -1; i--) {//前15位或者前18位倒序存进数组 [forwardDescArr addObject:forwardArr[i]];
} NSMutableArray * arrOddNum = [[NSMutableArray alloc] initWithCapacity:0];//奇数位*2的积 < 9 NSMutableArray * arrOddNum2 = [[NSMutableArray alloc] initWithCapacity:0];//奇数位*2的积 > 9 NSMutableArray * arrEvenNum = [[NSMutableArray alloc] initWithCapacity:0];//偶数位数组 for (int i=0; i< forwardDescArr.count; i++) { NSInteger num = [forwardDescArr[i] intValue]; if (i%2) {//偶数位 [arrEvenNum addObject:[NSNumber numberWithInteger:num]];
}else{//奇数位 if (num * 2 < 9) {
[arrOddNum addObject:[NSNumber numberWithInteger:num * 2]];
}else{ NSInteger decadeNum = (num * 2) / 10; NSInteger unitNum = (num * 2) % 10;
[arrOddNum2 addObject:[NSNumber numberWithInteger:unitNum]];
[arrOddNum2 addObject:[NSNumber numberWithInteger:decadeNum]];
}
}
}

__block NSInteger sumOddNumTotal = 0;
[arrOddNum enumerateObjectsUsingBlock:^(NSNumber * obj, NSUInteger idx, BOOL *stop) {
sumOddNumTotal += [obj integerValue];
}];

__block NSInteger sumOddNum2Total = 0;
[arrOddNum2 enumerateObjectsUsingBlock:^(NSNumber * obj, NSUInteger idx, BOOL *stop) {
sumOddNum2Total += [obj integerValue];
}];

__block NSInteger sumEvenNumTotal =0 ;
[arrEvenNum enumerateObjectsUsingBlock:^(NSNumber * obj, NSUInteger idx, BOOL *stop) {
sumEvenNumTotal += [obj integerValue];
}]; NSInteger lastNumber = [lastNum integerValue]; NSInteger luhmTotal = lastNumber + sumEvenNumTotal + sumOddNum2Total + sumOddNumTotal; return (luhmTotal%10 ==0)?YES:NO;
}

- (BOOL)isIPAddress{ NSString *regex = [NSString stringWithFormat:@"^(\\\\d{1,3})\\\\.(\\\\d{1,3})\\\\.(\\\\d{1,3})\\\\.(\\\\d{1,3})$"]; NSPredicate *pre = [NSPredicate predicateWithFormat:@"SELF MATCHES %@",regex]; BOOL rc = [pre evaluateWithObject:self]; if (rc) { NSArray *componds = [self componentsSeparatedByString:@","]; BOOL v = YES; for (NSString *s in componds) { if (s.integerValue > 255) {
v = NO; break;
}
} return v;
} return NO;
} @end
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: