Java 获取Html文本中的img标签下src中的内容
2018-01-16 15:30
941 查看
/**
* 得到网页中图片的地址
* @param sets html字符串
*/
public Set<String> getImgStr(String htmlStr) {
Set<String> pics = new HashSet<String>();
String img = "";
Pattern p_image;
Matcher m_image;
String regEx_img = "<img.*src\\s*=\\s*(.*?)[^>]*?>";
p_image = Pattern.compile(regEx_img, Pattern.CASE_INSENSITIVE);
m_image = p_image.matcher(htmlStr);
while (m_image.find()) {
// 得到<img />数据
img = m_image.group();
// 匹配<img>中的src数据
Matcher m = Pattern.compile("src\\s*=\\s*\"?(.*?)(\"|>|\\s+)").matcher(img);
while (m.find()) {
pics.add(m.group(1));
}
}
return pics;
}
* 得到网页中图片的地址
* @param sets html字符串
*/
public Set<String> getImgStr(String htmlStr) {
Set<String> pics = new HashSet<String>();
String img = "";
Pattern p_image;
Matcher m_image;
String regEx_img = "<img.*src\\s*=\\s*(.*?)[^>]*?>";
p_image = Pattern.compile(regEx_img, Pattern.CASE_INSENSITIVE);
m_image = p_image.matcher(htmlStr);
while (m_image.find()) {
// 得到<img />数据
img = m_image.group();
// 匹配<img>中的src数据
Matcher m = Pattern.compile("src\\s*=\\s*\"?(.*?)(\"|>|\\s+)").matcher(img);
while (m.find()) {
pics.add(m.group(1));
}
}
return pics;
}
相关文章推荐
- Java 获取Html文本中的img标签下src中的内容
- Java 获取Html文本中的img标签下src中的内容方法
- Java去掉字符串中所有的标签,获取纯文本内容,获取src
- Java后台去除前台传递数据中的页面标签(HTML,Javascript,Style),获取文本内容!
- 关于java 获取 html select标签 下拉框 option 文本内容 隐藏域
- java获取html文档中的所有img标签
- Java读取html中所有img标签的src值
- 富文本怎么只获取文字内容去除html标签
- 获取img标签中的src内容
- java 替换文本内容中的html标签
- JAVA 过滤标签将html内容转换为文本
- 获取文本中所有的<img>标签的位置,获取所有img标签的src
- 正规则获取内容中img等标签的src值
- JAVA过滤标签实现将html内容转换为文本的方法示例
- JAVA获取html网页中的图片src内容
- 怎么用正则表达式获取文章内容中的&lt;img标签和 src的路径
- Java去掉字符串中所有的标签,获取纯文本内容
- jQuery获取标签文本内容和html内容的方法
- JAVA 过滤标签将html内容转换为文本
- 使用java正则表达式过滤HTML ,获取<body>标签中的内容解决思路