gpt4 book ai didi

sql - 检测帖子评级系统的滥用

转载 作者:行者123 更新时间:2023-12-04 20:53:09 24 4
gpt4 key购买 nike

我正在使用一个名为“GD Star Rating”的 wordpress 插件来允许我的用户对我发布到我的网站之一的故事进行投票。 http://everydayfiction.com/最近我们一直在滥用该系统。显然被人为投票的故事。当用户对故事进行投票时,“GD Star Rating”会创建一些详细的日志。包含; IP、投票时间和 user_adgent 等。

例如这个故事有 181 票,平均 5.7 http://www.everydayfiction.com/snowman-by-shaun-simon/大多数其他故事每天只能获得大约 40 票。

  • 一开始我以为这个故事是在社交书签网站 Digg、Stumbleupon 等网站上...但是在查看日志后我发现这个故事的流量和普通故事一样多~ 2k-3k。

  • 我检查了这个垂直故事的所有投票是否来自同一个 IP 地址。如果用户在学校的计算机实验室使用他们所有的实验室计算机对这个故事进行投票,我可以看到这种情况发生。这个故事的日志中没有一个重复的 IP 地址。

    SELECT ip, COUNT(*) 作为计数 FROM wp_gdsr_votes_log WHERE id=3932 GROUP BY (ip ) 按 count DESC

  • 排序
  • 接下来,我认为一个用途可能是使用代理来为故事投票。我通过将所有浏览器 user_agent 分组在一起来检查是否有单个浏览器以垂直方式投票。最多 7 个用户使用类似的浏览器但偶尔投票(1-5),没有错误行为的证据。

    SELECT user_agent,COUNT(*) as count FROM wp_gdsr_votes_log WHERE id=3932 GROUP BY ( user_agent ) 按 count DESC

  • 排序
  • 我还会检查是否所有选票都一次性收到。也许有人有一个非常有趣的机器人,它可以更改 user_adgent 并使用代理,等等......在 2 分钟内最多有 5 票。人们投票的方式似乎没有任何规律(即 5 票不是一分钟一次)

    SELECT * FROM wp_gdsr_votes_log WHERE id =3932 AND vote=5 ORDER BY wp_gdsr_votes_log.已投票 DESC

这个问题的明显解决方案是强制人们在允许投票之前登录。但我宁愿不必走那条路,除非绝对必要。

我正在寻找关于检测滥用行为的测试建议。

编辑

我刚刚测试的另一件事是查看是否所有为这个 perdicutre 故事投票的人都是第一次通过 IP 地址在网站上投票。似乎有大约 80 人(按 IP 地址)首先对这个故事进行了投票,没有其他故事。我将其与其他故事进行核对,发现大多数情况下情况恰恰相反,80% 的投票人也在几个不同的故事中投票。我认为这证明这里发生了一些可疑的事情,但我不确定他们会怎么做或者我如何过滤掉人工投票。

SELECT id, `ip`, COUNT(*) as count FROM `wp_gdsr_votes_log` GROUP BY (`ip` ) ORDER BY `count` ASC 

编辑2

哇,好吧,它看起来像来自 http://www.mychemicalromance.com/ 的乐队成员之一(节奏吉他手)在他们的推特和乐队网站上发布了关于这篇文章的链接。令我感到惊讶的是,访问者并没有大幅增加,只有人们投票赞成这个故事。

最佳答案

也许这根本不是问题。也许您偶然发现了更多人真正关心并实际投票的故事。

您可能会检查的一件事是与具有类似流量的其他故事相比,投票与流量的百分比。

我读过。好故事。我也投票了。 ;)

关于sql - 检测帖子评级系统的滥用,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2932955/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com