Java进阶(十九)利用正则表达式批处理含链接内容文档
2015-11-30 10:24
531 查看
利用正则表达式批处理含链接内容文档
由于项目需求,自己需要将带有链接的标签去除,例如<a href="/zhaoyao/17-66.html">头晕</a>,转换后的文档为头晕。
由于说明书数量太大(100,569)自己需要采用批处理的方式进行操作。以后用户访问的就是批处理后的文档。故采用正则表达式的形式进行文档处理。
要读取文档内10w多条的数据,可按照3步走战略:
1.外层循环利用文件过滤器读取文件夹内所有符合条件的文件。
2.读取每一个筛选到的文件,利用正则表达式去除超链接符号。
3.将每一个处理过的文件重写回源文件。
工程源代码详情点击下载。
相关文章推荐
- JPA和spring data
- java排序
- java开发数据库连接池配置
- 【Java并发编程实战】—–“J.U.C”:ReentrantLock之二lock方法分析
- 不设置JAVA_HOME运行eclipse
- 【Java并发编程实战】—–“J.U.C”:ReentrantLock之一简介
- JAVA中对存储过程的调用方法(引)
- 【Java并发编程实战】—–“J.U.C”:锁,lock
- Struts2:文件上传下载
- java for循环的各种写法
- 【Java并发编程实战】—–synchronized
- 【Java并发编程实战】-----线程基本概念
- spring3.1 profile 配置不同的环境
- java自定义注解注解方法、类、属性等等【转】
- java中将图片保存到数据库中
- Struts2:类型转换器
- Java学习日记-2.2 增强后的switch-case
- SSH:Hibernate框架(Hibernate注解配置)
- Struts2:访问不同的方法
- Java安全之证书与PKI