gpt4 book ai didi

python - 使用 python 快速扩展缩短的 URL

转载 作者:行者123 更新时间:2023-11-28 21:51:26 25 4
gpt4 key购买 nike

我正在编写 Python 代码来扩展从 Twitter 获取的缩短的 URL。我已获取所有 URL 并将它们存储在一个由换行符分隔的文本文件中。

目前我正在使用:

response = urllib2.urlopen(url)
return response.url

扩展它们。

但是urlopen()方法在扩展url方面似乎不是很快。

我有大约 540 万个 URL。有没有更快的方法来使用 Python 扩展它们?

最佳答案

我怀疑问题是网络调用很慢,并且 urllib 阻塞直到它得到响应。因此,例如,假设从 URL 缩短服务获得响应需要 200 毫秒,那么您将只能使用 urllib 每秒解析 5 个 URL。但是,如果您使用异步库,您应该能够在获得第一个答案之前发送大量请求。然后在响应返回到您的代码时对其进行处理。这应该会显着提高您的吞吐量。有一些用于此类事情的 Python 库(Twisted、gevent 等),因此您可能只想在 Google 上搜索“Python async rest”。

您也可以尝试使用大量线程来执行此操作(我认为 urllib2 会在等待响应时释放 GIL,但不确定)。这不会像异步一样快,但仍然可以加快速度。

这两种解决方案都引入了相当多的复杂性,但如果您想快速...

关于python - 使用 python 快速扩展缩短的 URL,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30223421/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com