gpt4 book ai didi

Java:解析html文件并提取文本

转载 作者:行者123 更新时间:2023-11-30 06:24:36 25 4
gpt4 key购买 nike

我想解析一个 HTML文件并存储粗体文本(在 <b> 标签内)。一种解决方案是逐行读取文件并拆分或使用 RegEx .这意味着我应该将整个页面存储在 String 中。多变的?如果我不将它保存在变量中,那么我无法保证标签的开头和结尾在同一行。

您有什么建议?

最佳答案

使用JSoup解析内容

String html = "<html><head><title>First parse</title></head>"
+ "<body><p>Parsed HTML into a doc.</p></body></html>";

Document doc = Jsoup.parse(html);

关于Java:解析html文件并提取文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16654995/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com