gpt4 book ai didi

proxy - 在抓取中使用随机用户代理与代理?

转载 作者:行者123 更新时间:2023-12-01 04:53:42 26 4
gpt4 key购买 nike

我最近在研究网络抓取。
我发现我们可以使用代理或随机用户代理来远离反抓取检测。

代理和随机用户代理之间有什么区别吗?

因为当我了解到两者都用于隐藏原始客户端请求身份时,我感到困惑。

如果我的理解有误,请告诉我

最佳答案

Useragent 和 proxy 是完全不同的概念

1) 用户代理 : 用户代理将通过标题发送到目标网站

当我向 stackoverflow 发送请求时,我的用户代理是:

用户代理: Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:68.0) Gecko/20100101 Firefox/68.0

它说我正在使用 mozilla 和 linux + 其他信息。在 linux 上使用相同浏览器(firefox 5.0)的每个人都将拥有相同的用户代理。

这个库将帮助你找到网络上最常用的用户代理,让你的用户代理看起来是匿名的:https://github.com/Lobstrio/shadow-useragent

2) 代理

代理将让您将您的 IP 地址隐藏在代理后面。您定位的网站将收到代理的 IP 地址,而不是您的 IP 地址。如果您的 ip 被网站封锁,那么使用代理通常会解锁网站。

在抓取过程中您可能会被阻止的原因可能有很多,但在某些情况下,旋转 ip 和用户代理可能是有效的

关于proxy - 在抓取中使用随机用户代理与代理?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38895965/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com