gpt4 book ai didi

java - 使用受密码保护的网站的 Jsoup 获取 HTML 源代码

转载 作者:行者123 更新时间:2023-11-28 00:21:18 25 4
gpt4 key购买 nike

正如标题所说,我正在尝试使用Jsoup,具体方法

String html = Jsoup.connect(page.getUrl()).get().html(); 

网站受用户名和密码保护,我有登录凭据,但如果我尝试获取页面源,Url 会重定向到“请登录”页面。我不拥有该网站(无法直接访问数据库)。此外,我不知道 http 或 Javascript。在 Activity 中,用户将在 web View 中导航并登录到该网站,一旦他们登录,我将获取 URL 并尝试获取源(使用上述方法)。

总而言之,我可以使用 Jsoup 成功获取源代码,但 URL 重定向到登录页面。

提前谢谢你。

最佳答案

您必须使用您的 java 代码登录该网站。使用实时 http header [firefox 插件] 查看所有 http header 并尝试使用您的 java 代码发送这些 header ,以便该网站认为网络浏览器正在尝试连接到它。

简而言之,尝试使用您的 Java 代码模拟浏览器的行为和操作。

您可以通过以下代码使用 Jsoup 登录:

Document doc = Jsoup.connect("http://www.example.com/login.php")
.data("username", "myUsername")
.data("password", "myPassword")
.post();

然后尝试读取页面的html

关于java - 使用受密码保护的网站的 Jsoup 获取 HTML 源代码,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8677062/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com