gpt4 book ai didi

python - wget 与 python 的 urlretrieve

转载 作者:太空狗 更新时间:2023-10-29 19:30:15 24 4
gpt4 key购买 nike

我的任务是从网站下载 Gbs 的数据。数据以 .gz 文件的形式存在,每个文件大小为 45mb。

获取文件的简单方法是使用“wget -r -np -A files url”。这将以递归格式下载数据并镜像网站。下载速率非常高,4mb/秒。

但是,为了玩玩,我还使用 python 构建了我的 urlparser。

通过 Python 的 urlretrieve 下载非常慢,可能是 wget 的 4 倍。下载速率为 500kb/秒。我使用 HTMLParser 来解析 href 标签。

我不确定为什么会这样。有没有这方面的设置。

谢谢

最佳答案

可能是您的单位数学错误。

只是注意到 500KB/s (kilobytes) is equal to 4Mb/s (megabits) .

关于python - wget 与 python 的 urlretrieve,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/974741/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com