gpt4 book ai didi

java - 需要帮助从 url 下载 pdf 文件。文件访问受到限制

转载 作者:行者123 更新时间:2023-11-30 05:35:22 24 4
gpt4 key购买 nike

我正在尝试验证 pdf 信件的内容以进行测试自动化。为此,首先我尝试将 pdf 文件下载到本地计算机并进行验证。但我无法使用 Java 正确下载该文件。pdf 作为嵌入文档存在于页面中,需要我先登录。 html 如下所示

<td colspan="2" style="vertical-align:top;" id="frameCell_24743998"><iframe id="viewFrame_24743998" src="https://wewewe.net/ewr/ww/desk/ViewQCWalzPDFAction.do?recordId=24743998&amp;we=we&amp;partitionId=16515&amp;Id=1561024580039s79n0a" height="550" width="800" style="width: 1254px;"></iframe><br></td>

所以我已经得到了 url 并尝试使用

下载文件
FileUtils.copyURLToFile(new URL("https://wewewe.net/ewr/ww/desk/ViewQCWalzPDFAction.do?recordId=24743998&amp;we=we&amp;partitionId=16515&amp;Id=1561024580039s79n0a"), new File("C:\\workspace\\dfdf\\dfdffddf\\dd.pdf"));

但它正在显示

java.net.ConnectException: Connection timed out: Exception.

这是因为我还没有登录该应用程序并尝试下载。还有其他方法可以下载吗?

最佳答案

Is there any other way to download it?

这很大程度上取决于该网页的构建方式。

例如,可以在 Java 代码中使用 cookie,请参阅 here有关如何执行此操作的一些说明。含义:您可以使您的 java 代码显示为“已授权”。

如果所有这些都不起作用(并且调整服务器以允许“编程”访问此类文件不是一个选项),那么您可以使用自动化工具,例如selenium 进行“类似浏览器”的连接+下载。请参阅there寻求指导。

关于java - 需要帮助从 url 下载 pdf 文件。文件访问受到限制,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56760839/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com