- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
Reddit 对于热门帖子有不同的存储桶。他们有“此时”、“今天”、“本周”、“本月”、“今年”、“所有时间”。我能想到的创建这些列表的最佳方法是用时间戳保存每个投票,以便您可以计算每个存储桶的帖子分数。这将是一个昂贵的查询,但他们可以摆脱它,因为 Top 对于所有用户来说都是相同的,并且变化不大,因此他们可以缓存查询结果。
这只是我对正在发生的事情的最佳猜测,但我很好奇,这是 Reddit 实际正在做的事情还是有更好的方法?
最佳答案
首先,“这个小时”、“今天”、“本周”等都是指提交(链接/评论)创建的时间,而不是投票发生的时间。我将在这里重点关注链接,但评论也会以类似的方式处理以显示在用户页面上。
简短回答:一堆 cron 作业拉取相关时间段,对链接进行排序并按 subreddit 进行分组,然后存储缓存的链接列表以供快速阅读。
详细来说,每个时间段都有不同的 cron 作业。例如,“当前最佳”作业的运行频率比“今年最佳”作业的运行频率高得多。每个作业要做的第一件事就是从数据库中拉出在感兴趣的时间段内创建的所有链接的列表。这些数据被转储到一个文本文件中,原始的映射缩减系统在其中处理数据。链接已分组并排序。最终结果列表将作为链接 ID 的简单列表放入 Cassandra,可以非常快速地根据请求进行查找。
来源:https://github.com/reddit/reddit/blob/master/scripts/compute_time_listings
FWIW,个人投票确实附加了时间戳,但它们不直接用于跟踪热门。
关于reddit - Reddit 如何追踪热门帖子,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21449696/
Reddit 对于热门帖子有不同的存储桶。他们有“此时”、“今天”、“本周”、“本月”、“今年”、“所有时间”。我能想到的创建这些列表的最佳方法是用时间戳保存每个投票,以便您可以计算每个存储桶的帖子分
我正在尝试使用 praw.reddit 命令抓取 Reddit,但我不断收到以下信息: prawcore.exceptions.OAuthException: unauthorized_client
我正在尝试使用 praw.reddit 命令抓取 Reddit,但我不断收到以下信息: prawcore.exceptions.OAuthException: unauthorized_client
我正在使用 passport-reddit 在我的 node.js 网络服务器上实现 Reddit 登录系统。我现有的系统返回我需要的用户的所有信息,除了他们的电子邮件地址。我想知道社区中是否有人知道
我一直在查看REDDIT api文档,仅通过查看它,似乎无法(?)向另一个Reddit用户发送PM消息。请证明我错了:) 是否可以看到其他用户的 subredddit 订阅? 感谢您提供任何意见。 最
我正在尝试获取帖子上的 self.text 并使用此路线: reddit('/r/Denmark/comments/2jc5yk/how_to_live_in_denmark.json').listi
是否可以通过URL发布指向Reddit的链接? 例如,对于Facebook,您可以 Share Stackoverflow on your profile! Reddit是否具有我可以点击以共
我知道有一种方法可以将链接发布到reddit。 https://www.reddit.com/r/test/submit?title=myTitle&url=http://www.exampledsf
我正在尝试使用 Snoocore 库以编程方式向 Reddit 发布评论。 这是我的代码: function postComment() { var commentText =
我正在制作一个自动回复机器人,该机器人扫描给定命令的r/所有提交评论,例如。 !命令 当它检测到此命令时,将使用字符串回复注释: eg. "Hello" 我得到的错误是新帐户有一个限制,即新帐户每10
我正在尝试获取特定文章的所有 reddit 评论。 在 Reddit API 页面上,似乎暗示: www.reddit.com/r/subreddit/comments/ARTICLE 会给我这些结果
我正在使用 chrome 开发人员工具查看代码,并尝试在我的网站上模拟它,但它的工作方式不同。 显然通过设置边距:0;,边距被删除,但边距在技术上不需要为负数就没有空间了吗? 我没有在 css 格式中
当你点击 reddit 注册按钮时,一个漂亮的窗口弹出,屏幕的其余部分变黑。您可以单击屏幕的其余部分以关闭弹出窗口。 我知道我可以为此使用最外层的 div,但 reddit 是这样做的吗?他们是否也在
Reddit 使用时间衰减算法。这意味着排序顺序可能会发生变化。当用户转到第 2 页时,是否有一种机制可以防止他们看到位于第 1 页但在翻页之前被跳到第 2 页的帖子?这只是排序方法的一个可接受的缺陷
我四处搜寻,找不到有同样问题的人,所以希望这不是多余的。 我试图让 chrome 扩展在每次 Reddit 增强套件加载新页面时修改 DOM(永无休止的自动滚动或其他内容)。 window.addEv
reddit 预览 gif 和图像。我厌倦了发布我的一些页面,但当添加了 html/javascript 时,reddit 不会预览我的 gif。然后我粘贴了一个imgur链接this is te i
我们有一个类似reddit的PHP网站,用户可以为故事投票。 我们尝试在网站上使用 APC、memcached 等,但我们放弃了。问题是我们想要使用缓存机制,但用户可以在网站上随时投票,并且缓存的数据
我有一个接收 Reddit 评论并吐出回复的功能。我希望此函数映射到 Reddit 上发布的每条新评论。 我应该如何从 reddit 获取评论?经常拉取 100 条最近的评论似乎有点浪费,这样就不会遗
我正在尝试异步(或延迟加载)此 Reddit 小部件,但遇到问题。 下面是直接在 html 中完美运行的基本代码: 如果我尝试将其移至我的 scripts.js 中执行其他 jQuery 内
背景:我目前正在使用 praw 制作 Reddit 机器人。 Python 3.7 的库。我的机器人需要做的一件事是检查某些 Reddit 子版 block 上的最新帖子,看看它们是否仅包含图像而没有
我是一名优秀的程序员,十分优秀!