gpt4 book ai didi

xml - 无法使用 wget 检索完整文件

转载 作者:塔克拉玛干 更新时间:2023-11-03 02:10:16 25 4
gpt4 key购买 nike

我正在尝试从一个来源下载 feed.xml。我成功地能够在Windows中下载它。虽然它在 linux/unix 机器上失败了。

这些是我窗口上的请求 header 和响应 header 。

Response Header: Connection keep-alive
Content-Disposition attachment; filename="feeds.xml";
Content-Type text/xml
Date Wed, 24 Dec 2014 04:18:59 GMT
Expires Mon, 1 Jan 2000 00:00:00 GMT
Server nginx/1.2.3
Transfer-Encoding chunked
X-Powered-By PHP/5.3.13

Request: Accept text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8
Accept-Encoding gzip, deflate
Accept-Language en-US,en;q=0.5
Connection keep-alive
Host www2.xyz.com
User-Agent Mozilla/5.0 (Windows NT 6.1; WOW64; rv:34.0) Gecko/20100101 Firefox/34.0

我的 linux/unix 代码/命令从 url 下载文件。

wget --no-check-certificate -O  feed.xml 'http://www2.xyz.com/feed.php?id=XXX-YYY&pass=*******'

在 Windows 中,它的大小是 980MB,在 Linux 中,它的大小是 12MB。如果我尝试执行 less feed.xml,那么它会在 linux/Unix 中显示此消息。

"feed.xml" may be a binary file.  See it anyway?

我也试过设置标题,它给了我这样的响应,但没有下载完整的文件。

  wget  -S --header="Accept-Encoding: gzip"  'http://www2.xyz.com'

Connecting to www2.XYZ.com|***.**.**.**|:80... connected.
HTTP request sent, awaiting response...

HTTP/1.1 200 OK
Server: nginx/1.2.3
Date: Wed, 24 Dec 2014 03:50:51 GMT
Content-Type: text/xml
Content-Length: 12252156
Connection: keep-alive
X-Powered-By: PHP/5.3.13
Expires: Mon, 1 Jan 2000 00:00:00 GMT
Content-encoding: gzip
Content-disposition: attachment; filename="feeds.xml";
Length: 12252156 (12M) [text/xml]

我如何解决这个问题并可以在 linux 中下载 feed.xml。请帮助。

最佳答案

header 信息显示内容编码为 gzip。可能是 Windows 上的 gzip 为你扩展了这个,而在 Linux 上它没有,你只能使用压缩文件。

尝试这样做:

gzcat feed.xml > feed_expanded.xml

或者如果你没有 gzcat:

mv feed.xml feed.xml.gz; gunzip feed.xml.gz

关于xml - 无法使用 wget 检索完整文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27631609/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com