gpt4 book ai didi

javascript - CasperJS 和 PhantomJS 触发 "site is offline"浏览器没有

转载 作者:行者123 更新时间:2023-11-29 15:20:56 26 4
gpt4 key购买 nike

所以我正在尝试抓取一个站点 ( https://shop.advanceautoparts.com/ ),并且在过去几周内我可以通过 CasperJS 正常访问它。当我现在尝试这样做时(大约 2 天前),我收到一条奇怪的消息,说该网站已离线:

enter image description here

当我在普通浏览器或 PhantomJS 上尝试时,我得到的是普通网站。我试过在不同的计算机上执行此操作,更改我的 IP,更改用户代理但没有任何效果。

编辑

在 PhantomJS 上尝试相同的操作后,运行代码大约 5 次后,我得到了相同的消息。这是该网站为防止抓取而采取的措施吗?

最佳答案

我怀疑该网站知道您正在根据您的用户代理进行抓取,因为您多次点击它

也许可以尝试随机化您的用户代理,看看会发生什么。 ( see list here )

var casper = require('casper').create({
pageSettings: {
userAgent: "USE SOME OTHER USER AGENT HERE"
}
});

但是,在多个并发请求后,该站点也可能被 IP 地址阻止。因此也尝试 a) 放慢你的脚本或者 b) 导航到不同的页面

编辑

我已经编写了一个测试脚本,并且对我来说一切正常。 重要的是:

casper.waitUntilVisible("#header-top", function() {

enter image description here

HTH

关于javascript - CasperJS 和 PhantomJS 触发 "site is offline"浏览器没有,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43712234/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com