gpt4 book ai didi

python - PRAW:将 Comment 和 Submission 对象序列化为 JSON

转载 作者:行者123 更新时间:2023-11-30 23:21:55 24 4
gpt4 key购买 nike

我目前正在开发一个 reddit 爬虫,使用 praw 进行一些数据挖掘。我想从 subreddits 中抓取评论和提交内容,然后将它们保存在数据库或文件中,最好以 json 格式保存以供以后使用。我在尝试将评论和提交对象序列化为 python 中的 JSON 对象时遇到问题。是否有现有的方法或途径可以做到这一点?注意:我对 python 也很陌生。

预先感谢您的帮助!

最佳答案

更新---------

看来这已经不可能了,向安托万致敬

https://github.com/praw-dev/praw/issues/701

我不确定是否有办法序列化您需要的内容,但您可以使用以下方式保存提交 ID:

some_id = sub.id

然后稍后使用

检索它们
r.get_submission(submission_id=some_id)

编辑-----------------------------------------------------

所以做了一些研究,发现了这个:https://github.com/praw-dev/praw/issues/271

所以本质上你可以使用以下方式打开存储 json:

r.config.store_json_result = True

然后,您可以使用评论或提交的 json_dict 成员访问 json 数据。

关于python - PRAW:将 Comment 和 Submission 对象序列化为 JSON,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24748803/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com