phantomjs - 可靠地检测基于 PhantomJS 的垃圾邮件机器人-6ren

phantomjs - 可靠地检测基于 PhantomJS 的垃圾邮件机器人

转载作者：行者123 更新时间：2023-11-28 07:29:50

25

4

有什么方法可以一致地检测 PhantomJS/CasperJS 吗？我一直在处理用它构建的恶意垃圾邮件机器人的争论，并且能够根据某些行为大部分阻止它们，但我很好奇是否有一种可靠的方法来知道 CasperJS 是否正在使用，例如处理不断的适应有点烦人。

我不相信使用验证码。它们是一种负面的用户体验，并且 ReCaptcha 从未在我的 MediaWiki 安装上阻止垃圾邮件。由于我们的网站没有用户注册(匿名讨论板)，因此我们需要为每个帖子添加验证码条目。我们每天都会收到数千个合法帖子，验证码会看到这个数字是炸弹。

最佳答案

我非常同意您对验证码的看法。我将列出到目前为止我能够检测到的内容，对于我自己的检测脚本来说，具有类似的目标。这只是部分的，因为它们还有更多 headless browsers .

使用公开的窗口属性来检测/假设那些特定的 headless 浏览器相当安全:

window._phantom (or window.callPhantom) //phantomjs
window.__phantomas //PhantomJS-based web perf metrics + monitoring tool 
window.Buffer //nodejs
window.emit //couchjs
window.spawn  //rhino

以上内容摘自jslint doc并使用 phantom js 进行测试。

浏览器自动化驱动程序(由 BrowserStack 或其他 Web 捕获服务用于快照):

window.webdriver //selenium
window.domAutomation (or window.domAutomationController) //chromium based automation driver

这些属性并不总是公开的，我正在寻找其他更强大的方法来检测此类机器人，完成后我可能会作为完整的脚本发布。但这主要回答了你的问题。

这是另一种相当完善的方法，可以更广泛地检测支持 JS 的 headless 浏览器:

if (window.outerWidth === 0 && window.outerHeight === 0){ //headless browser }

这应该可以很好地工作，因为即使虚拟视口(viewport)大小是由 headless 浏览器设置的，属性默认情况下也为 0，并且默认情况下它无法报告大小不存在的浏览器窗口。特别是 Phantom JS doesn't support outerWith or outerHeight 。

附录:然而，外部/内部尺寸存在 Chrome/Blink 错误。 Chrome does not report those dimensions when a page loads in a hidden tab ，例如从上一个 session 恢复时。 ~~Safari 似乎没有这个问题。~~。

更新:事实证明，iOS Safari 8+ 有一个错误，outerWidth 和outerHeight 为0，Sailfish webview 也可以。因此，虽然它是一个信号，但如果不注意这些错误，就不能单独使用它。因此，警告:除非您确实知道自己在做什么，否则请不要使用此原始代码片段。

PS:如果您知道此处未列出的其他 headless 浏览器属性，请在评论中分享。

关于phantomjs - 可靠地检测基于 PhantomJS 的垃圾邮件机器人，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/29246204/

25

4

0

文章推荐： iOS - 模棱两可的布局

文章推荐： javascript - 排序问题 - 在 Javascript 中索引多维数组

文章推荐： javascript - Skype JavaScript 插件格式

文章推荐： javascript - Socket.io客户端: respond to all events with one handler?

python - [可靠];使用多个字典
我正在尝试运行以下内容:: Press to see code - name: Snapshot BI nodes hosts: [CLUSTER-BI,CLUSTER-BI-REPL
c# - 可靠、持久堆栈的技术
在这里尝试心理重置:我尝试使用 MSMQ 创建一个可靠、持久的堆栈，但没有成功所以更一般地说: 我有生产者(一个 web 服务，虽然“只有一个”，但也是多线程的)/消费者(多个进程，根据需要设置)。
.net - 可靠(耐用)的分布式日志记录引擎
试图为分布式系统找到一个商业日志框架。此框架必须允许远程服务器上的 .NET 应用程序记录可以在中央位置收集的消息。如果可能，中央位置应将消息存储在 SQL Server 数据库中。要求: 能够在远
java - 安心服务可靠
我正在开发 Restful 服务，我们将在数据库中插入/更新新记录。由于REST使用HTTP进行通信，而HTTP并不可靠，我担心如果连接失败，请求可能无法发送到服务器。我在 link 中找到的建议
jquery - 安全、可靠、正确的服务器端密码验证响应应该是什么？
我正在尝试实现一个页面，员工可以在其中登录并添加、修改、更新工作案例。我有一个选择列表，其中包含从数据库加载的数据(员工姓名)。在这个数据库中，我有基本信息、用户名、ID、密码、电子邮件。选择列表
python - 不同的平方值方法会导致输出略有不同——哪种方法最准确/可靠？
我在 C 代码和 Python 代码之间(偶尔)得到略有不同的计算结果，并设法找到了一个例子。在 Python 中，我得到了这个: >>> print "%.55f" %\ ... (-2.49999
java - EJB 计时器是否应该持久/可靠？
例如如果我将计时器设置为每天午夜到期，如果一个“失火”(例如，由于服务器关闭而不会触发回调)会发生什么？我在文档中找不到它。有没有办法让这个定时器在服务器重启时立即触发回调？ PS:我了解 Quar
tensorflow - 在序列模型中使用填充时，Keras 验证准确性是否有效/可靠？
我有一组不同长度的非零序列，我正在使用 Keras LSTM 对这些序列建模。我使用 Keras Tokenizer 进行分词(分词从 1 开始)。为了使序列具有相同的长度，我使用了填充。填充示例:
没有传输安全性的 WCF 可靠 session 不会按时发生故障事件
我遇到了一个非常有趣的可靠 session 行为。我正在使用 netTcp 绑定(bind) + 双工 channel + 可靠 session 。当我尝试在 channel.faulted 上收听
sql - 可靠 SELECT + UPDATE 的事务与行标记
问题: 给定表 table_a 和 table_b，每当 table_a 更新时，我都需要可靠地(并发地)执行这样的操作: SELECT table_a 中的一些行。在应用程序代码中计算一些内容。
Redis - 使用 BRPOPLPUSH 时清理处理队列的更好方法(可靠)
我们目前的设计环境 Redis 2.8.17 我们已经实现了我们的可靠队列，使用类似于 redis 文档中描述的模式的模式，在 RPOPLPUSH 下但是，考虑到其阻塞性质，我们正在使用 BRPO
wcf - WCF 可靠 session 的问题(可靠消息传递)
在我们的 WCF 应用程序中，我正在尝试配置可靠的 session 。服务: 客户:
delphi - 为什么 FindWindow() 不是 100% 可靠？
我使用这个 Delphi 7 代码来检测 Internet Explorer 是否正在运行: function IERunning: Boolean; begin Result := FindWi
java - 可靠/支持良好的库作为 GPS 单元的接口(interface)？
我正在准备构建一个应用程序，该应用程序能够向 GPS 设备发送/接收航路点。通过一些谷歌搜索，我发现了很多可能对此目的有用的库: Java Chaeron GPS GPSLib4J Python Py
c# - 了解 WCF 可靠 session 重试行为
我有几个关于 WCF 可靠 session 可靠性的问题: WCF 是否在重试期间重新序列化消息？ 2。如果 1 是正确的 - 它是否在消息参数被处理后发生？ 3. 如果 2 是正确的 - 是否有任何
javascript - $(this)[0].defaultValue 的安全/可靠/跨浏览器兼容性如何
对于使用 $(this)[0].defaultValue 来确定文本框值是否已从原始值发生变化的一些反馈，我将不胜感激，例如 //keyUp event if($(this)[0].defaultVa
mongodb - 选择/配置数据库以获得高吞吐量、可靠、一致的写入吞吐量，牺牲延迟
我正在开发一个具有以下特征的实时应用程序: 数百个客户端将同时插入行/文档，每个客户端每隔几秒插入一行。大部分仅追加；几乎所有的行/文档，一旦插入，就永远不会改变。只有当数据刷新到磁盘时，客户端才
python - 在 Python 中对用户提供的字符串运行 .format() 是否安全/可靠？
场景:最终用户(不受信任的)提供了一个字符串，例如 "Hello, {name}!" .在服务器上，我想以 my_string.format(name="Homer") 的形式对该用户提供的字符串进行
ios - PushNotifications 在 iOS 中无法正常(可靠)工作
我在推送通知方面遇到一些问题。我们使用 Firebase 来推送通知。问题是我可以在一台 iPhone 上正确接收 PushNotifications，但无法在另一台 iPhone 上接收它们。我在
c++ - 这是在 c++ 可靠/安全中尝试更多 python 风格的装饰器吗？
从 python 到 c++，这是我能得到的最接近 python 的装饰器。这个解决方案感觉有点像 hack，因为在要装饰的函数之后运行的代码在 Timer 析构函数中是隐式调用的。不过它确实有效。

首页

博学

6Ren·AI

商城

phantomjs - 可靠地检测基于 PhantomJS 的垃圾邮件机器人