gpt4 book ai didi

url - 在不记录每次点击的情况下估算每小时 URL 点击次数的聪明方法?

转载 作者:行者123 更新时间:2023-12-04 22:07:01 25 4
gpt4 key购买 nike

我有一个包含数百万个 URL 的网站。每次单击 URL 时,都会更新与该 URL 对应的数据库行,以指示该单击的时间戳。我想肯定会使用额外的列,但不需要为每次点击插入不同的行,估计此 URL 每小时接收的点击次数。一些想法包括存储一些与最近的秒、分钟、15 分钟和小时间隔对齐的时间戳(但这个想法对我来说是模糊的,它实际上是如何得到我们想要的),或者更讨厌的序列化解决方案在某种序列化行中“记录”时间增量。

虽然一种简单的方法建议测量当前点击和最后一次点击之间的时间以确定点击率,但只有在链接以非常一致的点击率时才会产生有用的估计。实际上,该链接可能会在一分钟内获得一连串的点击,而在另外 20 分钟内什么都没有。

我不想清楚地记录每次点击的原因只是为了避免每小时增加数千个额外的 INSERT 语句(以及一个多小时前的数据的相应 DELETE),或者替代地我不必启动额外的存储系统(东京暴君、grepping apache 日志等)来记录这些点击。

最佳答案

如何在 memcached 中存储一个计数器,由 URL 键入,并在数据库中存储一个 last_counter_reset_time

Memcached 有一个轻量级的原子 incr 操作。在每个请求上调用它。定期重置计数器,更新 last_counter_reset_time

我不是 memcached 的老手,但我想有一些方法可以相当确定所有 URL 的计数器都保持缓存状态。没有持久性,因此您可能随时丢失计数器,但偶尔丢失这种数据可能是可以接受的。

关于url - 在不记录每次点击的情况下估算每小时 URL 点击次数的聪明方法?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1544159/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com