如何使用java的正则表达式提取html标签?
2015-11-24 16:37
751 查看
import java.util.ArrayList;
import java.util.Iterator;
import java.util.List;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class Test {
public static void main(String args[]) {
String html = "<title>ABCD</title>gsdggas<title></title>jkll<title>005</title>";
// 简单示例,相当于String html=getHtml(String urlString);
List resultList = getContext(html);
for (Iterator iterator = resultList.iterator(); iterator.hasNext();) {
String context = (String) iterator.next();
System.out.println(context);
}
}
/**
* 提取"<title>XXXX</title>"中的文字XXXX
* @param html 要解析的html文档内容
* @return 解析结果,可以多次匹配,每次匹配的结果按文档中出现的先后顺序添加进结果List
*/
public static List getContext(String html) {
List resultList = new ArrayList();
Pattern p = Pattern.compile("<title>([^</title>]*)");//匹配<title>开头,</title>结尾的文档
Matcher m = p.matcher(html );//开始编译
while (m.find()) {
resultList.add(m.group(1));//获取被匹配的部分
}
return resultList;
}
}
相关文章推荐
- 《JAVA与模式》之合成模式
- Quartz Spring与Spring Task总结
- 教你学会java基础多线程系列文章之基础篇
- Java正则表达式提取html纯文本
- Java基础---IO流(上)
- ubuntu中netbean ide中文乱码
- 数组的基本操作(一)
- java正则表达式取得html标签内的内容
- Java记录 -86- Reflection API的使用示例进阶2
- 我的第五个java程序 每过10秒读取一次天气 并把天气更新到mysql数据库里
- Spring Data JPA 持久层开发
- MyEclipse Import 工程 Unknown Faceted Project Problem (Java Version Mismatch) 问题解决!
- Eclipse配置JDK的源代码的src.zip
- 浅谈Java中的hashcode方法
- 解决eclipse编译的几种方法
- spring mvc注解例子
- java程序中调用scilab
- java正则表达式修改html标签中属性
- SSM框架——详细整合教程(Spring+SpringMVC+MyBatis)
- 使用Java正则表达式匹配、替换HTML内容