gpt4 book ai didi

bash - wget维基媒体图像?

转载 作者:行者123 更新时间:2023-11-29 09:48:44 24 4
gpt4 key购买 nike

我正在尝试使用指向文件命名空间中页面的 URL 从维基共享资源下载图像:

wget http://commons.wikimedia.org/wiki/File:A_golden_tree_during_the_golden_season.JPG

我得到的只是一个无法打开的 JPG 文件。但是当你转到链接时,你实际上看到的是页面而不是图像本身,但是有一个名为“全分辨率”的链接将你发送到真实图像链接,即:http://upload.wikimedia.org/wikipedia/commons/9/92/A_golden_tree_during_the_golden_season.JPG

如何仅通过第一个链接下载此文件?

最佳答案

您可以尝试以下方法:

wget http://commons.wikimedia.org/wiki/File:A_golden_tree_during_the_golden_season.JPG -O output.html; wget $(cat output.html | grep fullMedia | sed 's/\(.*href="\/\/\)\([^ ]*\)\(" class.*\)/\2/g')

第一个 wget 获取您指定的链接。我浏览了几页,发现高分辨率图像在 div 下,class=fullMedia。它解析图像的 url,然后获取该图像。

附注:正如上面所建议的,bash 并不是执行此操作的好方法。你应该看看解析 dom 树的东西。

关于bash - wget维基媒体图像?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15036304/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com