gpt4 book ai didi

python - 在 Python 中扫描一组 URL 的最快方法是什么?

转载 作者:太空宇宙 更新时间:2023-11-04 07:23:15 25 4
gpt4 key购买 nike

我需要扫描一组给定的 URL 并获取 HTTP 状态代码,例如 Python 中的“200 OK”。我目前正在使用 urllib 来执行此操作。有更快的方法吗?

Python代码

def get_status(url):
try:
return urllib.urlopen(url).getcode()

except StandardError :
return None

最佳答案

Couple 评论我会做出更快更快乐的状态检查。第一个技巧是使用 http HEAD 方法。这只要求服务器提供 http header (包括状态代码),而无需它也为页面正文提供服务。

第二个 urllib 有效,但我建议使用精彩的 Requests库,它为几乎所有您想用 http 做的事情提供了更好的 api。

最后我会使用 gevents库使您能够异步下载每个 header ,从而大大加快整个过程。

关于python - 在 Python 中扫描一组 URL 的最快方法是什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11565606/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com