您的位置:首页 > 编程语言 > Java开发

java正则表达式注意事项

2015-07-30 19:45 375 查看
最近写爬虫,遇到一个让我几乎接近崩溃的问题.

之前一直都是在配置文件中配置的网页地址,正则表达式等.

可是现在将这些参数一直到数据库就一直有问题.老是匹配不上正则:

比如: \\S*.(htm|html)\\S*(这个是数据库中读取出来的正则) 和 \S*.(html|htm)\S*(这个是配置文件中获取到后的正则)

很明显吧.\杠的问题. 但是在配置文件中也是用的\\表示的呀.

<span style="font-size:14px;">urlRule=/\\S*.(html|htm)\\S*</span>
我就奇了怪了, 配置文件中的双斜杠赋值给变量后就变成了单斜杠,数据库中的双斜杠赋值给变量后还是双斜杠.

我开始一直以为是线程的问题,后面反复测试,发现是数据库取出的数据就不能匹配,配置文件的就可以.

没搞懂这是怎么回事,反正最终的问题就是把数据库的双斜杠变成单斜杠就可以了.

望大神们指点这是怎么回事.





内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息