gpt4 book ai didi

python - 从特定的 subreddit 获取过去两个月的所有提交(使用 PRAW)?

转载 作者:行者123 更新时间:2023-11-28 22:32:24 25 4
gpt4 key购买 nike

我试图获取过去两个月的所有/r/politics 帖子以及所有评论和用户详细信息。我如何使用 PRAW 执行此操作?

我应该浏览 get_hot() 中的帖子吗?关于如何解决这个问题的任何想法?是否有任何我可以利用的时间戳方法?

最佳答案

您可以使用 Cloudsearch syntax在 2 个时间戳之间搜索。语法是:

timestamp:START_UNIX_TIMESTAMP..END_UNIX_TIMESTAMP

如果您希望返回的条目少于 1000 个,只需设置一个搜索来执行此操作应该相对简单。不过,搜索查询限制为 1000 个请求,因此如果帖子数量超出预期,则需要一些特殊逻辑。

要搜索过去 2 个月内的任何帖子,请尝试:

import time
current_timestamp = time.time()
# 60 seconds * 60 minutes * 24 hours * 60 days = 2 months
two_months_timestamp = current_timestamp - (60 * 60 * 24 * 60)
query = 'timestamp:{}..{}'.format(current_timestamp, two_months_timestamp)
results = reddit.subreddit('test').search(query, sort='new')

如果您需要获取超过 1000 个,我建议获取搜索结果中最后一项的时间戳,然后存储它的时间戳并搜索 timestamp:<current_timestamp>..<last_item_timestamp>并重复直到没有更多结果。

关于python - 从特定的 subreddit 获取过去两个月的所有提交(使用 PRAW)?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40960449/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com