您的位置:首页 > 编程语言 > Java开发

Java 获取Html文本中的img标签下src中的内容

2018-01-16 15:30 941 查看
/** 

     * 得到网页中图片的地址 

     * @param sets html字符串 

     */  

    public  Set<String> getImgStr(String htmlStr) {  

        Set<String> pics = new HashSet<String>();  

        String img = "";  

        Pattern p_image;  

        Matcher m_image;  

        String regEx_img = "<img.*src\\s*=\\s*(.*?)[^>]*?>";  

        p_image = Pattern.compile(regEx_img, Pattern.CASE_INSENSITIVE);  

        m_image = p_image.matcher(htmlStr);  

        while (m_image.find()) {  

            // 得到<img />数据  

            img = m_image.group();  

            // 匹配<img>中的src数据  

            Matcher m = Pattern.compile("src\\s*=\\s*\"?(.*?)(\"|>|\\s+)").matcher(img);  

            while (m.find()) {  

                pics.add(m.group(1));  

            }  

        }  

        return pics;  

    }  
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: