gpt4 book ai didi

phantomjs - 可靠地检测基于 PhantomJS 的垃圾邮件机器人

转载 作者:行者123 更新时间:2023-11-28 07:29:50 25 4
gpt4 key购买 nike

有什么方法可以一致地检测 PhantomJS/CasperJS 吗?我一直在处理用它构建的恶意垃圾邮件机器人的争论,并且能够根据某些行为大部分阻止它们,但我很好奇是否有一种可靠的方法来知道 CasperJS 是否正在使用,例如处理不断的适应有点烦人。

我不相信使用验证码。它们是一种负面的用户体验,并且 ReCaptcha 从未在我的 MediaWiki 安装上阻止垃圾邮件。由于我们的网站没有用户注册(匿名讨论板),因此我们需要为每个帖子添加验证码条目。我们每天都会收到数千个合法帖子,验证码会看到这个数字是炸弹。

最佳答案

我非常同意您对验证码的看法。我将列出到目前为止我能够检测到的内容,对于我自己的检测脚本来说,具有类似的目标。这只是部分的,因为它们还有更多 headless browsers .

使用公开的窗口属性来检测/假设那些特定的 headless 浏览器相当安全:

window._phantom (or window.callPhantom) //phantomjs
window.__phantomas //PhantomJS-based web perf metrics + monitoring tool
window.Buffer //nodejs
window.emit //couchjs
window.spawn //rhino

以上内容摘自jslint doc并使用 phantom js 进行测试。

浏览器自动化驱动程序(由 BrowserStack 或其他 Web 捕获服务用于快照):

window.webdriver //selenium
window.domAutomation (or window.domAutomationController) //chromium based automation driver

这些属性并不总是公开的,我正在寻找其他更强大的方法来检测此类机器人,完成后我可能会作为完整的脚本发布。但这主要回答了你的问题。

这是另一种相当完善的方法,可以更广泛地检测支持 JS 的 headless 浏览器:

if (window.outerWidth === 0 && window.outerHeight === 0){ //headless browser }

这应该可以很好地工作,因为即使虚拟视口(viewport)大小是由 headless 浏览器设置的,属性默认情况下也为 0,并且默认情况下它无法报告大小不存在的浏览器窗口。特别是 Phantom JS doesn't support outerWith or outerHeight

附录:然而,外部/内部尺寸存在 Chrome/Blink 错误。 Chrome does not report those dimensions when a page loads in a hidden tab ,例如从上一个 session 恢复时。 Safari 似乎没有这个问题。

更新:事实证明,iOS Safari 8+ 有一个错误,outerWidth 和outerHeight 为0,Sailfish webview 也可以。因此,虽然它是一个信号,但如果不注意这些错误,就不能单独使用它。因此,警告:除非您确实知道自己在做什么,否则请不要使用此原始代码片段。

PS:如果您知道此处未列出的其他 headless 浏览器属性,请在评论中分享。

关于phantomjs - 可靠地检测基于 PhantomJS 的垃圾邮件机器人,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29246204/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com