gpt4 book ai didi

java - 如何使用 JSoup 通过标签获取元素? - java

转载 作者:太空宇宙 更新时间:2023-11-04 16:31:12 25 4
gpt4 key购买 nike

如何使用 JSoup(http://jsoup.org/)通过标签获取元素?

我有以下输入并需要以下输出,但我没有在 <source>...<\source> 中获取文本标签:

[输入:]

<html>
<something>
<source>foo bar bar</source>
<something>
<source>foo foo bar</source>
</html>

[期望输出:]

foo bar bar
foo foo bar

我试过这个:

import java.io.*;
import java.util.List;

import org.apache.commons.io.IOUtils;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;

public class HelloJsoup {
public static void main(String[] args) throws IOException {

String br = "<html><source>foo bar bar</source></html>";
Document doc = Jsoup.parse(br);
//System.out.println(doc);
for (Element sentence : doc.getElementsByTag("source"))
System.out.print(sentence);

}
}

但它输出:

<source></source>

最佳答案

您需要使用 xmlParser(),您可以将其传递给 parse() 方法:

String br = "<html><source>foo bar bar</source></html>";
Document doc = Jsoup.parse(br, "", Parser.xmlParser());

for (Element sentence : doc.getElementsByTag("source"))
System.out.println(sentence.text());

}

文档中有更多相关信息:http://jsoup.org/apidocs/org/jsoup/parser/Parser.html#xmlParser()

关于java - 如何使用 JSoup 通过标签获取元素? - java ,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21677926/

25 4 0