java正则表达式注意事项
2015-07-30 19:45
375 查看
最近写爬虫,遇到一个让我几乎接近崩溃的问题.
之前一直都是在配置文件中配置的网页地址,正则表达式等.
可是现在将这些参数一直到数据库就一直有问题.老是匹配不上正则:
比如: \\S*.(htm|html)\\S*(这个是数据库中读取出来的正则) 和 \S*.(html|htm)\S*(这个是配置文件中获取到后的正则)
很明显吧.\杠的问题. 但是在配置文件中也是用的\\表示的呀.
我开始一直以为是线程的问题,后面反复测试,发现是数据库取出的数据就不能匹配,配置文件的就可以.
没搞懂这是怎么回事,反正最终的问题就是把数据库的双斜杠变成单斜杠就可以了.
望大神们指点这是怎么回事.
之前一直都是在配置文件中配置的网页地址,正则表达式等.
可是现在将这些参数一直到数据库就一直有问题.老是匹配不上正则:
比如: \\S*.(htm|html)\\S*(这个是数据库中读取出来的正则) 和 \S*.(html|htm)\S*(这个是配置文件中获取到后的正则)
很明显吧.\杠的问题. 但是在配置文件中也是用的\\表示的呀.
<span style="font-size:14px;">urlRule=/\\S*.(html|htm)\\S*</span>我就奇了怪了, 配置文件中的双斜杠赋值给变量后就变成了单斜杠,数据库中的双斜杠赋值给变量后还是双斜杠.
我开始一直以为是线程的问题,后面反复测试,发现是数据库取出的数据就不能匹配,配置文件的就可以.
没搞懂这是怎么回事,反正最终的问题就是把数据库的双斜杠变成单斜杠就可以了.
望大神们指点这是怎么回事.
相关文章推荐
- Android之获取手机上的图片和视频缩略图thumbnails
- Python3写爬虫(四)多线程实现数据爬取
- Scrapy的架构介绍
- msql 正则表达式
- 正则表达式
- 数据库链接字符串查询网站
- Java简单字符串插值实现
- DB2实例管理
- DB2实例管理
- 保障MySQL数据安全的14个最佳方法
- mysql问答汇集
- 创建一个空的IBM DB2 ECO数据库的方法
- Access 2000 数据库 80 万记录通用快速分页类
- Mootools 1.2教程 正则表达式
- 开通一个数据库失败的原因的和解决办法
- 一个简单的asp数据库操作类
- CentOS下DB2数据库安装过程详解
- EasyASP v1.5发布(包含数据库操作类,原clsDbCtrl.asp)第1/2页
- sql2008 还原数据库解决方案