gpt4 book ai didi

python - 用 Python 的 "wget"覆盖现有文件?

转载 作者:行者123 更新时间:2023-12-03 23:05:06 25 4
gpt4 key购买 nike

我已经在我的 Python 上安装了 wget,并且我正在使用它从不同的 URL 下载文件。到目前为止,我的代码如下所示:

import wget
urls = ['https://www.iedb.org/downloader.php?file_name=doc/epitope_full_v3.zip',
'https://www.iedb.org/downloader.php?file_name=doc/tcell_full_v3.zip',
'https://www.iedb.org/downloader.php?file_name=doc/bcell_full_v3.zip',
'https://www.iedb.org/downloader.php?file_name=doc/mhc_ligand_full_single_file.zip']
path = '/home/david/data/files/zip_files'

for url in urls:
wget.download(url, path)
我希望我的代码覆盖下载的文件(如果它们存在),这样每次运行代码时我都会获得该文件的最新版本,而不是保留旧文件并下载具有不同名称的新文件(例如,如果epitope_full_v3.zip 已经存在,当我执行代码时它会再次下载它,但会保留旧的并将新的重命名为 epitope_full_v3_1.zip)。
我知道 wget 可以在 shell 中使用 -O 参数来允许您这样做,但我还没有在文档中看到 python 版本的参数。我感谢您的帮助。

最佳答案

虽然 wget没有提到,你可以自己改变。使用os.path.basename()获取文件名,并检查它是否存在。像这样:

import wget
import os

urls = ['https://www.iedb.org/downloader.php?file_name=doc/epitope_full_v3.zip',
'https://www.iedb.org/downloader.php?file_name=doc/tcell_full_v3.zip',
'https://www.iedb.org/downloader.php?file_name=doc/bcell_full_v3.zip',
'https://www.iedb.org/downloader.php?file_name=doc/mhc_ligand_full_single_file.zip']

path = '/home/david/data/files/zip_files'

for url in urls:
filename = path + '/' + os.path.basename(url) # get the full path of the file
if os.path.exists(filename):
os.remove(filename) # if exist, remove it directly
wget.download(url, out=filename) # download it to the specific path.

关于python - 用 Python 的 "wget"覆盖现有文件?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/63226700/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com