gpt4 book ai didi

python - 如何在 Python 中使用 VPN 进行网页抓取?

转载 作者:行者123 更新时间:2023-12-05 01:38:38 37 4
gpt4 key购买 nike

我制作了一个 Python 程序,它使用 Beautifulsoup 对 IMDB 进行网络抓取,以制作一个 mySQL 数据库,其中包含不同类别中所有评分最高的电影的表格。到目前为止,一切都很好。我的问题是我在挪威做这件事,很多电影片名都被翻译成挪威语。例如,在从挪威 IP 地址打开的 IMDB 顶部列表中,“肖申克的救赎”被翻译为“Frihetens Regn”。我想要所有的英文标题。是否有一些可以从 Python 激活并与 Beautifulsoup 一起使用的免费 VPN?或者有人对此有其他解决方案吗?

最佳答案

您有几个选项,VPN 和代理。

首先,是的,您可以使用 VPN。然而,大多数 VPN 需要整个主机连接才能通过 VPN 建立隧道。那里有一些很好的 VPN 服务,但有时你会得到你付出的代价。我会谨慎使用免费 VPN,因为有些人会出售您的网络,而另一些人会出售您的数据。

其次,这可能是最简单的选择。使用代理。您可以告诉您的抓取工具通过免费的匿名代理代理流量。您可以从 Google 找到这些免费代理的列表。或者您可以查看 ProxyBroker为您找到免费代理。这只需要通过美国 IP 地址而不是整个主机连接来代理抓取工具流量。

关于python - 如何在 Python 中使用 VPN 进行网页抓取?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59511919/

37 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com