您的位置:首页 > 编程语言 > Java开发

JAVA大字符串存储采用静态HTML,通过jsoup 对 HTML 文档进行解析和操作

2018-02-11 11:28 330 查看
在页面上操作大字符串时,有可能超出数据库字段,可以考虑使用静态HTML存储字符串,然后通过HTML解析器进行解析

jsoup 是一款 Java 的 HTML 解析器,可直接解析某个 URL 地址、HTML 文本内容。它提供了一套非常省力的 API,可通过 DOM,CSS 以及类似于 jQuery 的操作方法来取出和操作数据。

jsoup 的主要功能如下:

1、从一个 UR、文件或字符串中解析 HTML;

2. 使用 DOM 或 CSS 选择器来查找、取出数据;

3. 可操作 HTML 元素、属性、文本;

jsoup解析提取HTML片段

import org.jsoup.Connection;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
Connection connect = Jsoup.connect(htmlUrl);
connect.timeout(15000);
Document doc = connect.get();
Element content = doc.getElementById("pageContent");
document.write(content.html());
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  jsoup