Java 获取Html文本中的img标签下src中的内容方法
2018-06-01 08:57
1081 查看
如下所示:
/** * 得到网页中图片的地址 * @param sets html字符串 */ public Set<String> getImgStr(String htmlStr) { Set<String> pics = new HashSet<String>(); String img = ""; Pattern p_image; Matcher m_image; String regEx_img = "<img.*src\\s*=\\s*(.*?)[^>]*?>"; p_image = Pattern.compile(regEx_img, Pattern.CASE_INSENSITIVE); m_image = p_image.matcher(htmlStr); while (m_image.find()) { // 得到<img />数据 img = m_image.group(); // 匹配<img>中的src数据 Matcher m = Pattern.compile("src\\s*=\\s*\"?(.*?)(\"|>|\\s+)").matcher(img); while (m.find()) { pics.add(m.group(1)); } } return pics; }
以上这篇Java 获取Html文本中的img标签下src中的内容方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持脚本之家。
您可能感兴趣的文章:
相关文章推荐
- Java 获取Html文本中的img标签下src中的内容
- Java 获取Html文本中的img标签下src中的内容
- Java去掉字符串中所有的标签,获取纯文本内容,获取src
- JAVA过滤标签实现将html内容转换为文本的方法示例
- jQuery获取标签文本内容和html内容的方法
- 关于java 获取 html select标签 下拉框 option 文本内容 隐藏域
- Java后台去除前台传递数据中的页面标签(HTML,Javascript,Style),获取文本内容!
- JAVA 过滤标签将html内容转换为文本
- 使用java正则表达式过滤HTML ,获取<body>标签中的内容解决思路
- JAVA读取WORD,EXCEL,PDF,TXT,RTF,HTML文件文本内容的方法
- 原来java的正则也很强大,搜索html文档,根据要求替换img标签中的src属性
- JAVA读取WORD,EXCEL,PDF,TXT,RTF,HTML文件文本内容的方法示例
- 正规则获取内容中img等标签的src值
- JAVA读取WORD,EXCEL,PDF,TXT,RTF,HTML文件文本内容的方法示例
- JAVA读取WORD,EXCEL,PDF,TXT,RTF,HTML文件文本内容的方法示例
- JavaScript查找Html字符串中的img标签替换src属性的内容
- 怎么用正则表达式获取文章内容中的&lt;img标签和 src的路径
- Java读取html中所有img标签的src值
- JAVA读取WORD,EXCEL,PDF,TXT,RTF,HTML文件文本内容的方法示例 .
- paip.uapi 获取网络url内容html 的方法java php ahk c++ python总结.