- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我正在尝试从 subreddit 中抓取所有评论。我找到了一个名为 PRAW 的图书馆。举个例子
import praw
r = praw.Reddit('Comment parser example by u/_Daimon_')
subreddit = r.get_subreddit("python")
comments = subreddit.get_comments()
但是,这只会返回最近的 25 条评论。我如何解析 subreddit 中的所有评论?在 Reddit 界面上,有一个 next
按钮,因此应该可以逐页返回历史记录。
最佳答案
来自 the docs :
See UnauthenticatedReddit.get_comments() for complete usage.
那个函数有*args和**kwargs,函数注释:
The additional parameters are passed directly into get_content(). Note: the url parameter cannot be altered.
因此,我查看了该函数(找到它 here )。 get_content
的参数之一是limit。
limit – the number of content entries to fetch. If limit <= 0, fetch the default for your account (25 for unauthenticated users). If limit is None, then fetch as many entries as possible (reddit returns at most 100 per request, however, PRAW will automatically make additional requests as necessary).
(强调)。所以我的测试是:
comments=subreddit.get_comments(limit=None)
我收到了 30 多条评论(可能是 100 条的限制,但我必须手动查看它们,所以我认为 30 条就足够了)。
关于python - 如何从 Reddit 上的 subreddit 中抓取所有评论?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31102861/
我有一个功能可以在 2014-11-01 和 2015-10-31 之间抓取比特币 subreddit 中的所有帖子。 但是,我只能提取到 10 月 25 日为止的大约 990 个帖子。我不明白发生了
我目前正在尝试使用 subreddit 主题并将图像调整为更大/上传图像的实际大小。 Logo 的当前代码是: /* SUBEDDIT LOGO ADDON ---------------------
摘要:我想网络抓取 subreddit,然后将数据转换为数据帧。我知道如何单独完成它们。但我坚持使用一个函数。下面是我一一的做法。 url = 'https://api.pushshift.io/re
我无法理解这在 praw API 中是否可行:我想获得所有评论中提到关键字(比如“python”)的帖子的列表。似乎搜索功能总是从特定的 subreddit 中调用,如 for submission
我正在尝试将用户指定为论坛类别的版主。目前,我只是试图显示用户可以添加版主 subreddit/{id}/moderators 的路线并显示 subreddit 名称。 为此,我得到No query
我正在尝试编写一个聊天机器人,我想为其提供来自特定子版 block 的数据,例如https://www.reddit.com/r/leagueoflegends/ 我已经能够在递归循环的同时抓取所有评
我正在尝试遍历 subreddits,但想忽略顶部的置顶帖子。我能够打印前 5 个帖子,不幸的是包括即时贴。尝试跳过这些的各种 pythonic 方法都失败了。下面是我的代码的两个不同示例。
我想获得在特定 subreddit(例如 r/gaming)中发表评论的每个 redditor 的所有评论。我知道如何查询 subreddits: SELECT * FROM [fh-bigquery
我正在寻找 reddit API 中的示例。我想从某个 subreddit (http://www.reddit.com/r/VillagePorn) 中提取图像并将它们放在网页上。我见过其他网站这样
我试图在一次 api 调用中从 random subreddit 中提取随机发帖,但我不知道该怎么做。这可能吗?如果不可能,我将如何通过多次 api 调用和最小的开销来实现这一点? 以下请求返回一个随
我正在尝试使用 PRAW 从最新到最旧迭代某个 subreddit 的提交。我以前是这样做的: subreddit = reddit.subreddit('LandscapePhotography')
我将如何获得 新品 JSON 中 subreddit 的帖子?只需将 .json 附加到 url (http://www.reddit.com/r/SOME_SUBREDDIT/new.json) 就
在 PowerShell 中通过 API 检索 subreddit 链接的好方法是什么? 最佳答案 如果将 .json 放在 URI 的末尾,Reddit 通过 JSON 提供内容,PowerShel
我的代码当前从给定的 Reddit 子版下载图像,并将它们命名为原始文件名。我希望代码做的是将它们命名为 Reddit 上发布的名称。有人可以帮我吗?我认为这与 Submission.title 有关
我试图获取过去两个月的所有/r/politics 帖子以及所有评论和用户详细信息。我如何使用 PRAW 执行此操作? 我应该浏览 get_hot() 中的帖子吗?关于如何解决这个问题的任何想法?是否有
我需要随时获取 subreddit 中的热门评论。 我已经尝试抓取所有提交的内容,并遍历它们,但不幸的是,您可以获得的帖子数量限制为 1000。 我试过使用 Subreddit.get_comment
有没有办法在不使用 PRAW 的函数 submissions() 的情况下从 subreddit 获取所有提交?通过提交,我能够在两个时间戳之间搜索来自给定 subreddit 的所有提交。但现在 R
我可以使用下面的代码获取某一天的热门帖子。有什么办法可以将其更改为所有时间的热门帖子吗? import praw user_agent = "Comment Reader 1.0 by /u/crow
我想收集 subreddit 上所有帖子的标题,我想知道最好的方法是什么? 我环顾四周,发现了一些关于 Python 和机器人的内容。我还简要了解了 API,但不确定该往哪个方向走。 因为我不想 pr
我想生成一个使用特定 subreddit 的用户的用户名列表。 据我所知,不可能简单地获得订阅 subreddit 的用户列表。如果那不可能,最好浏览所有线程并查看谁发表了评论。 我该如何处理? 最佳
我是一名优秀的程序员,十分优秀!