gpt4 book ai didi

java - 使用 JavaRegex 或 Jsoup 解析 Html 标签

转载 作者:行者123 更新时间:2023-12-01 12:46:56 25 4
gpt4 key购买 nike

我需要解析无序列表项的文本。我的来源如下:

<ul>
<li><em><strong><span style="color:#FFFFF">Bolded and Colored Text</span></strong> </em></li>
<li>No Styling...Just a Text</li>
<li><u><b>Bolded </b> and <i>Italic </i> and Underlined Text</u></li>
<li><u>Underline Started and <span style="color:#FFFFF>Only Colored Text</span> Underline Ended</u></li>

现在我需要获取标签内的每个文本:

tag, subtag text

最佳答案

Jsoup 将是一个不错的选择。你可以像这样解析它

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;

public class JsoupParser {

public static void main(String args[]) {
String html = "<ul>"
+ "<li><em><strong><span style=\"color: #FFFFF\">Bolded and Colored Text</span></strong> </em></li>"
+ "<li>No Styling...Just a Text</li>"
+ "<li><u><b>Bolded </b> and <i>Italic </i> and Underlined Text</u></li>"
+ "<li><u>Underline Started and <span style=\"color: #FFFFF\">Only Colored Text</span> Underline Ended</u></li>"
+ "</ul>";

Document doc = Jsoup.parse(html);
for(Element elem : doc.select("*")){
System.out.println("Tag Name : " + elem.tagName());
System.out.println("Value : " + elem.text());
System.out.println();
}
}
}

关于java - 使用 JavaRegex 或 Jsoup 解析 Html 标签,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24605600/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com