gpt4 book ai didi

java - 使用 jsoup 从 url 中提取适当的内容

转载 作者:行者123 更新时间:2023-12-01 13:51:21 24 4
gpt4 key购买 nike

我正在研究如何使用 Jsoup 提取 CNN 或纽约时报等新闻文章的内容。

事实上我已经尝试过以下代码:

Document document = Jsoup.connect("http://edition.cnn.com/2013/11/10/world/asia/philippines-typhoon-haiyan/index.html").get();

Element contents = document.select("#content").first();

System.out.println(contents.html());

System.out.println(contents.text());

我收到此错误:

Exception in thread "main" java.lang.NullPointerException
at com.clearforest.Test.main(Test.java:36)

请您知道如何从文章中提取正确的文本。

最佳答案

select 调用后,您的 contents 元素 为 null - 您指定的选择器在从 CNN 下载的文档中没有返回任何匹配项 - 尝试类似 document.select 的内容("div.cnn_strycntntlft") 返回故事 div 内容。

关于java - 使用 jsoup 从 url 中提取适当的内容,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19934541/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com