gpt4 book ai didi

ruby-on-rails - 使用 Nokogiri 抓取 Reddit(429 请求太多)

转载 作者:太空宇宙 更新时间:2023-11-03 17:14:30 29 4
gpt4 key购买 nike

我正在尝试使用 Nokogiri 抓取 Reddit,但是一次运行就一直告诉我我提出了太多请求。

require 'nokogiri'
require 'open-uri'
url = "https://www.reddit.com/r/all"
redditscrape = Nokogiri::HTML(open(url))

OpenURI::HTTPError: 429 Too Many Requests

这不是只有一个要求吗?如果不是,我该如何为 Nokogiri 创建 sleep 间隔?

最佳答案

Reddit 有一个 API

您可能会查询 API 以获取您想要抓取的特定子版 block 。考虑到高容量和嵌套的评论,试图抓取所有 Reddit 似乎是一场等待发生的噩梦。

看起来 Reddit 正在阻止抓取功能以支持使用他们的公共(public) API .

关于ruby-on-rails - 使用 Nokogiri 抓取 Reddit(429 请求太多),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38981732/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com