gpt4 book ai didi

java - 从动态网站读取信息

转载 作者:太空宇宙 更新时间:2023-11-04 07:14:13 24 4
gpt4 key购买 nike

我从早上起就一直在阅读这个问题,但找不到有关我的问题的大量信息。

所以,我想制作一个java应用程序,每次网站更新时从网站读取信息(字符串)。使用 Java 可以做到这一点吗?

我可以使用扫描仪吗?我看到一些推荐使用 Jsoup,但我还没有找到任何教程。事实上,我的大部分搜索结果都是不太有用的帖子。

那么,有人可以给出一个“类似教程”的答案以供将来引用吗?

最佳答案

通常,当您访问网站(动态或非动态)时,浏览器向您显示的是从网络服务器接收到的标记,该标记由浏览器解析并呈现以显示网站。

为了接收该标记,您的浏览器会向网络服务器发出一个(或多个)HTTP 请求。当您在浏览器地址栏中输入 URL www.stackoverflow.com 时,浏览器会向服务器生成 HTTP 请求。响应是网站的标记。

因此,无论网站的内容是否动态,此时都无关紧要,因为无论该请求是从浏览器还是从您的程序发送,对 URL 的请求(在给定时间)都会产生相同的标记。

所以,你需要做的是:

  1. 让您的程序请求网站标记
  2. 解析标记
  3. 做,需要用它做什么

有各种框架和 API 可以完成这项工作。正如您所提到的,其中之一是 jSoup。检查this出教程。

有些网站还允许在 URL 中传递参数,例如 www.somesite.com?foo=bar,这称为 GET 请求。还有 POST 请求和其他请求,但您需要自己阅读相关内容。

希望这有帮助。

关于java - 从动态网站读取信息,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20217939/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com