gpt4 book ai didi

javascript - 从 JS 重定向链接下载 pdf

转载 作者:太空宇宙 更新时间:2023-11-04 04:04:45 24 4
gpt4 key购买 nike

有什么方法可以从命令行下载以下 pdf 吗?

http://www.ofsted.gov.uk/provider/files/1295389/urn/EY298883.pdf   

一个简单的 wget http://www.ofsted.gov.uk/provider/files/1295389/urn/EY298883.pdf 返回一个网页。但是,如果您在 Firefox 中访问它,您会得到一个 pdf 文件。

相关于How to get a JS redirected pdf linked from a web page我试图找到 python 解决方案。

最佳答案

如果您不需要模拟网络浏览器并运行 JS 的通用答案(您需要这样做才能获得通用解决方案),但只需从自己获得的 html 中找到下载链接就可以了,那么您可以:

  1. wget 页面(wget 将遵循 HTTP 重定向,以便为您提供目标 html 以及执行下载的 JS)
  2. 然后您需要解析 HTML 并找到您要查找的链接
  3. 您需要wget该链接

我在 https://github.com/pjump/wgetbyCss 编写了一些简单的脚本来为您执行 2,3 操作为了使用它们,您需要

  • ruby
  • mechanize gem(gem install mechanize)

然后你可以这样做:

 ./wget_by_link_text 'http://www.ofsted.gov.uk/filedownloading/?id=1295389&type=1&refer=1' "Please download the requested file here"

即:

   ./wget_by_link_text url link_text [save_as]

通过文本获取该链接。或者,您可以使用 wget_by_css 脚本并通过其 .auto_click 类或其他一些 css 选择器获取链接。

关于javascript - 从 JS 重定向链接下载 pdf,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21675266/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com