gpt4 book ai didi

java - 将 Servlet 生成的图像 src 中的图像保存到硬盘

转载 作者:行者123 更新时间:2023-12-01 16:02:25 24 4
gpt4 key购买 nike

鉴于此 html 源代码,我不知道如何自动检索图像并将其保存到我的硬盘:

<img src="https://someRemoteServer/servlet/GetItemServlet?ts=32352.3&itemtype=blabla">

我尝试了 wget,但它只将请求 GetItemServlet 本身保存到我的硬盘上。

我想迭代远程服务器(我不拥有也没有后端访问权限)上的 700 个图像,并将它们全部保存到我的硬盘上并使用唯一标识符。

编辑:wget 的输出:

HTTP Request sent, waiting for Response... 200 OK
Länge: 0 [text/plain]
Save in »»GetItemServlet?ts=32352.3««.

文件本身大小为 0KB。

当 wget 解析它打印的许多参数时:

[29] 48426
[30] 48427
--2010-08-16 21:52:02-- https://media.myRemoteServer.com/servlet/GetItemServlet?ts=56555
-bash: 1281978458512=1: command not found

然后继续

[2]   Done                    itemtype_text=[Keine+Auswahl]
..
[29]- Done id=9
[30]+ Done res=2

编辑2:

转义“&”号和问号后,wget 表现更好,并返回完全不同的错误消息:

File name too long

Cannot write to >GetItemServlet?ts=32352.3&itemtype=blabla< (Unknown error: 0) 

编辑3:永无休止的故事。无论如何,这应该在 super 用户上。我缩短了 URL 名称,它现在运行并确实保存了一个文件。在这个似乎是 HTML 的文件中,它表示我的 session 已用完,我需要登录。不过,我确实使用 wget 提供了用户名和密码。但是,当通过浏览器手动登录该网站时,您必须通过表单登录来完成。

最佳答案

它应该工作得很好。也许水蛭会被自动检测并返回不同的响应。由于你没有详细讲述实际的 react ,所以这有点在黑暗中刺痛。尝试提供合法的用户代理,或维护 session ,或使用更智能的第 3 方窃取工具。

也就是说,您是否意识到大多数网站管理员并不真正欣赏此类行为?网络带宽和CPU负载不是免费的。

<小时/>

根据您的更新更新:该名称似乎太长,无法成为合法的另存为文件名,而且 ? 是文件名中的非法字符(位于至少在 Windows 中)。这可能就是这一切的根本原因。我不执行 wget,但您至少应该指定一个自定义输出文件名。它的手册中会有解释。这个问题现在可能更适合 http://superuser.com .

关于java - 将 Servlet 生成的图像 src 中的图像保存到硬盘,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3495934/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com