gpt4 book ai didi

python - 如何使用 scrapy 抓取 Instagram 查询?

转载 作者:行者123 更新时间:2023-12-01 01:55:54 24 4
gpt4 key购买 nike

我现在尝试抓取 Instagram 帖子查询的纯文本(“https://www.instagram.com/graphql/query/query_id=17888483320059182&id=USER_ID&first=50”),但只得到 403 和 301 响应。有人知道我如何绕过这些响应或抓取数据吗?

最佳答案

Instagram 会阻止使用 default Scrapy User-Agent 的请求。

您可以更改 Scrapy 的用户代理,以便它将使用看起来像真正的浏览器的用户代理。但你在抓取 Instagram 时仍然会遇到问题,如 this discussion 中评论的那样。 :请求限制等。

我提醒你scraping Instagram is against their TOS ,因此如果检测到抓取行为,他们最终会阻止您的帐户和/或 IP。

关于python - 如何使用 scrapy 抓取 Instagram 查询?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50194819/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com