gpt4 book ai didi

php - 这个访客是机器人还是用户? PHP

转载 作者:搜寻专家 更新时间:2023-10-31 21:46:21 24 4
gpt4 key购买 nike

我正在使用 Google Analytics(或任何其他)可以为我提供的定制功能进行自己的访问者跟踪。我在我的脚本快结束时调用了这个函数,但很快就遇到了我们的客户运行了数千个被机器人调用的页面(我假设是谷歌),我的表在一段时间内填满了大约 1,000,000 个无用和欺骗性的记录月。

大多数人使用的方法是在页面底部使用 Javascript,机器人不运行 javascript,因此这是一个简单的解决方案 -- 但我正在寻找 PHP 解决方案。

我做的最后一件事是使用 PHP 的 get_browser:

http://us2.php.net/manual/en/function.get-browser.php

并检查 crawler 方面。这没有用。

我看过这篇文章: Stopping scripters from slamming your website hundreds of times a second

但主要的解决方案是做一些类似于 SO 的事情,它会显示一个验证码。我的意思不是阻止机器人程序——我希望网页被抓取。我只是不想在他们在那里时发送我的访客跟踪数据。

我现在切换到 Javascript 解决方案,执行 AJAX 请求,因为我们的用户感到恼火和不准确的统计数据。

最佳答案

我以前从未使用过该功能 - 很有趣。

现在,所有主要的搜索引擎都将使用不同的 User-Agent header 声明自己,我认为该函数从中获取大部分信息 - 它可能将 User-Agent 值与查找表进行匹配,并且可能是新的索引器没有被正确识别。

您可以编写自己的列表,并针对它测试 $_SERVER['HTTP_USER_AGENT'] 超全局 - 但您必须监视更新。

它也不会阻止坏的或恶意的索引器,因为它们往往会将自己伪装成普通浏览器(就像来自客户端的任何其他 header 一样,User-Agent 是不可信的)。

关于php - 这个访客是机器人还是用户? PHP,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2919290/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com