gpt4 book ai didi

wget - 将使用 wget 下载的网页的目录索引重命名为 index.html

转载 作者:行者123 更新时间:2023-12-05 08:01:47 29 4
gpt4 key购买 nike

我目前正在使用一个相当复杂的 wget 命令,但它的本质是 -p-k 标志来下载所有先决条件。如何将主要下载文件重命名为 index.html?

比如我下载一个网页

http://myawesomewebsite.com/something/derp.html

例如,这将下载:

  1. derp.html
  2. style.css
  3. firstimage.png
  4. secondimage.jpg

甚至可能是 iFrame:

  1. iframe.html
  2. iframe-style.css

所以现在的问题是如何将 derp.html 重命名为 index.html,而不意外地将 iframe.html 重命名为 index.html 还有,因为我不知道解析的下载文件的名称是什么?

当我在 URL 为 http://something.tumblr.com/34324/post 的 Tumblr 页面上尝试此方法时,它下载为 page.html

我已经尝试了 --output-document 标志,但这导致根本没有下载任何内容。

谢谢!

最佳答案

这就是我最终做的:

如果下载后没有找到index.html,我用Ruby获取了URL的derp.html部分,然后搜索derp .html,然后将其重命名为 index.html

它没有我想要的那么优雅,但它确实有效。

关于wget - 将使用 wget 下载的网页的目录索引重命名为 index.html,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11949812/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com