gpt4 book ai didi

java - 解析以字符串形式找到的 HTML 转储的有效方法

转载 作者:行者123 更新时间:2023-12-02 07:51:55 24 4
gpt4 key购买 nike

请解决这个小问题。它可以在 stackoverflow 上找到。

我有一个字符串形式的网站 HTML 转储。我想从它的特定标签中提取文本。

换句话说,我想模仿

Document doc = Jsoup.connect(url).userAgent("Mozilla").get();
Elements links = doc.getElementsByTag("cite");

我没有使用 Jsoup,因为我不希望它连接到网站(我有另一个以文本形式返回 html 转储的服务)。我发现HTMLEditorKit用于将文本转换为 HTMLDocument,但它似乎不太容易使用(如 Jsoup 或 HTMLParser)或者我无法获取它。

任何帮助都会有用。

谢谢。

最佳答案

如果您已经使用过 Jsoup 并且它还有效,您应该继续使用它。

Document doc = Jsoup.parse("<html>...");

应该做。

参见:The API

关于java - 解析以字符串形式找到的 HTML 转储的有效方法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10136340/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com