- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
有什么方法可以一致地检测 PhantomJS/CasperJS 吗?我一直在处理用它构建的恶意垃圾邮件机器人的争论,并且能够根据某些行为大部分阻止它们,但我很好奇是否有一种可靠的方法来知道 CasperJS 是否正在使用,例如处理不断的适应有点烦人。
我不相信使用验证码。它们是一种负面的用户体验,并且 ReCaptcha 从未在我的 MediaWiki 安装上阻止垃圾邮件。由于我们的网站没有用户注册(匿名讨论板),因此我们需要为每个帖子添加验证码条目。我们每天都会收到数千个合法帖子,验证码会看到这个数字是炸弹。
最佳答案
我非常同意您对验证码的看法。我将列出到目前为止我能够检测到的内容,对于我自己的检测脚本来说,具有类似的目标。这只是部分的,因为它们还有更多 headless browsers .
使用公开的窗口属性来检测/假设那些特定的 headless 浏览器相当安全:
window._phantom (or window.callPhantom) //phantomjs
window.__phantomas //PhantomJS-based web perf metrics + monitoring tool
window.Buffer //nodejs
window.emit //couchjs
window.spawn //rhino
以上内容摘自jslint doc并使用 phantom js 进行测试。
浏览器自动化驱动程序(由 BrowserStack 或其他 Web 捕获服务用于快照):
window.webdriver //selenium
window.domAutomation (or window.domAutomationController) //chromium based automation driver
这些属性并不总是公开的,我正在寻找其他更强大的方法来检测此类机器人,完成后我可能会作为完整的脚本发布。但这主要回答了你的问题。
这是另一种相当完善的方法,可以更广泛地检测支持 JS 的 headless 浏览器:
if (window.outerWidth === 0 && window.outerHeight === 0){ //headless browser }
这应该可以很好地工作,因为即使虚拟视口(viewport)大小是由 headless 浏览器设置的,属性默认情况下也为 0,并且默认情况下它无法报告大小不存在的浏览器窗口。特别是 Phantom JS doesn't support outerWith or outerHeight 。
附录:然而,外部/内部尺寸存在 Chrome/Blink 错误。 Chrome does not report those dimensions when a page loads in a hidden tab ,例如从上一个 session 恢复时。 Safari 似乎没有这个问题。。
更新:事实证明,iOS Safari 8+ 有一个错误,outerWidth 和outerHeight 为0,Sailfish webview 也可以。因此,虽然它是一个信号,但如果不注意这些错误,就不能单独使用它。因此,警告:除非您确实知道自己在做什么,否则请不要使用此原始代码片段。
PS:如果您知道此处未列出的其他 headless 浏览器属性,请在评论中分享。
关于phantomjs - 可靠地检测基于 PhantomJS 的垃圾邮件机器人,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29246204/
我正在尝试运行以下内容:: Press to see code - name: Snapshot BI nodes hosts: [CLUSTER-BI,CLUSTER-BI-REPL
在这里尝试心理重置:我尝试使用 MSMQ 创建一个可靠、持久的堆栈,但没有成功 所以更一般地说: 我有生产者(一个 web 服务,虽然“只有一个”,但也是多线程的)/消费者(多个进程,根据需要设置)。
试图为分布式系统找到一个商业日志框架。此框架必须允许远程服务器上的 .NET 应用程序记录可以在中央位置收集的消息。如果可能,中央位置应将消息存储在 SQL Server 数据库中。 要求: 能够在远
我正在开发 Restful 服务,我们将在数据库中插入/更新新记录。 由于REST使用HTTP进行通信,而HTTP并不可靠,我担心如果连接失败,请求可能无法发送到服务器。 我在 link 中找到的建议
我正在尝试实现一个页面,员工可以在其中登录并添加、修改、更新工作案例。 我有一个选择列表,其中包含从数据库加载的数据(员工姓名)。在这个数据库中,我有基本信息、用户名、ID、密码、电子邮件。 选择列表
我在 C 代码和 Python 代码之间(偶尔)得到略有不同的计算结果,并设法找到了一个例子。在 Python 中,我得到了这个: >>> print "%.55f" %\ ... (-2.49999
例如如果我将计时器设置为每天午夜到期,如果一个“失火”(例如,由于服务器关闭而不会触发回调)会发生什么?我在文档中找不到它。 有没有办法让这个定时器在服务器重启时立即触发回调? PS:我了解 Quar
我有一组不同长度的非零序列,我正在使用 Keras LSTM 对这些序列建模。我使用 Keras Tokenizer 进行分词(分词从 1 开始)。为了使序列具有相同的长度,我使用了填充。 填充示例:
我遇到了一个非常有趣的可靠 session 行为。我正在使用 netTcp 绑定(bind) + 双工 channel + 可靠 session 。 当我尝试在 channel.faulted 上收听
问题: 给定表 table_a 和 table_b,每当 table_a 更新时,我都需要可靠地(并发地)执行这样的操作: SELECT table_a 中的一些行。 在应用程序代码中计算一些内容。
我们目前的设计 环境 Redis 2.8.17 我们已经实现了我们的可靠队列,使用类似于 redis 文档中描述的模式的模式,在 RPOPLPUSH 下 但是,考虑到其阻塞性质,我们正在使用 BRPO
在我们的 WCF 应用程序中,我正在尝试配置可靠的 session 。 服务: 客户:
我使用这个 Delphi 7 代码来检测 Internet Explorer 是否正在运行: function IERunning: Boolean; begin Result := FindWi
我正在准备构建一个应用程序,该应用程序能够向 GPS 设备发送/接收航路点。通过一些谷歌搜索,我发现了很多可能对此目的有用的库: Java Chaeron GPS GPSLib4J Python Py
我有几个关于 WCF 可靠 session 可靠性的问题: WCF 是否在重试期间重新序列化消息? 2。如果 1 是正确的 - 它是否在消息参数被处理后发生? 3. 如果 2 是正确的 - 是否有任何
对于使用 $(this)[0].defaultValue 来确定文本框值是否已从原始值发生变化的一些反馈,我将不胜感激,例如 //keyUp event if($(this)[0].defaultVa
我正在开发一个具有以下特征的实时应用程序: 数百个客户端将同时插入行/文档,每个客户端每隔几秒插入一行。 大部分仅追加;几乎所有的行/文档,一旦插入,就永远不会改变。 只有当数据刷新到磁盘时,客户端才
场景:最终用户(不受信任的)提供了一个字符串,例如 "Hello, {name}!" .在服务器上,我想以 my_string.format(name="Homer") 的形式对该用户提供的字符串进行
我在推送通知方面遇到一些问题。我们使用 Firebase 来推送通知。问题是我可以在一台 iPhone 上正确接收 PushNotifications,但无法在另一台 iPhone 上接收它们。我在
从 python 到 c++,这是我能得到的最接近 python 的装饰器。 这个解决方案感觉有点像 hack,因为在要装饰的函数之后运行的代码在 Timer 析构函数中是隐式调用的。不过它确实有效。
我是一名优秀的程序员,十分优秀!