gpt4 book ai didi

jsoup - 如何使用Jsoup从html中提取段落文本?

转载 作者:行者123 更新时间:2023-12-04 20:11:06 24 4
gpt4 key购买 nike

import java.io.IOException;
import java.util.logging.Level;
import java.util.logging.Logger;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

public class JavaApplication14 {


public static void main(String[] args) {
try {
Document doc = Jsoup.connect("tanmoy_mahathir.makes.org/thimble/146").get();
String html= "<html><head></head>" + "<body><p>Parsed HTML into a doc."
+ "</p></body></html>";
Elements paragraphs = doc.select("p");
for(Element p : paragraphs)
System.out.println(p.text());
} catch (IOException ex) {
Logger.getLogger(JavaApplication14.class.getName()).log(Level.SEVERE, null, ex);
}
}

}

任何人都可以帮助我使用 jsoup 代码我怎么能只解析包括段落的部分,以便只打印
Hello ,World!
Nothing is impossible

最佳答案

对于这一小部分 html,您只需要做

String html= "<html><head></head>" + "<body><p>Parsed HTML into a doc."+
+"</p></body></html>";
Document doc = Jsoup.parse(html);
Elements paragraphs = doc.select("p");
for(Element p : paragraphs)
System.out.println(p.text());

正如我看到您的链接包含几乎相同的 html,您还可以替换 doc 的定义和
Document doc = Jsoup.connect("https://tanmoy_mahathir.makes.org/thimble/146").get();

更新

这是对我来说编译和运行良好的完整代码。
import java.io.IOException;
import java.util.logging.*;
import org.jsoup.*;
import org.jsoup.nodes.*;
import org.jsoup.select.*;

public class JavaApplication14 {

public static void main(String[] args) {
try {
String url = "https://tanmoy_mahathir.makes.org/thimble/146";
Document doc = Jsoup.connect(url).get();
Elements paragraphs = doc.select("p");
for(Element p : paragraphs)
System.out.println(p.text());
}
catch (IOException ex) {
Logger.getLogger(JavaApplication14.class.getName())
.log(Level.SEVERE, null, ex);
}
}
}

关于jsoup - 如何使用Jsoup从html中提取段落文本?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17161243/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com