gpt4 book ai didi

java - JSoup 没有显示正确的文本

转载 作者:行者123 更新时间:2023-11-30 11:00:11 25 4
gpt4 key购买 nike

所以我想创建一个 Java 应用程序来抓取名为 chillstep.info 的网站的歌曲名称并将其保存到 .txt 文件中。然而 JSoup 打印出来:
<div id="titel">

</div>

代码如下:

public class Crawltitle {

public static void getTitle() throws IOException{
Document doc = Jsoup.connect("http://chillstep.info/").get();
String title = doc.getElementById("titel").outerHtml();
System.out.println(title);
}

public static void main(String[] args) throws IOException{
getTitle();
}
}

这个问题是因为网站(如果是,为什么以及如何解决这个问题)还是 JSoups?

最佳答案

标题通过

动态加载
http://chillstep.info/jsonInfo.php

如果您忽略通常允许的内容类型,您仍然可以使用 Jsoup 来获取它:

Connection con = Jsoup
.connect("http://chillstep.info/jsonInfo.php")
.ignoreContentType(true);
Response res = con.execute();
String rawJSON = res.body();

请注意,我没有使用 JSoup 解析器。因此,您还不如使用任何其他库来获取 HTTP 内容,例如 Apache HtmlClient 等。

此时您可以使用您选择的 json 库解析答案。或者“手动”操作,因为它非常简单:

String title = rawJSON.replaceAll(".*:\"([^\"]*).*","$1");

关于java - JSoup 没有显示正确的文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31636784/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com