gpt4 book ai didi

web-scraping - 是否可以使用 Scrapy 从 Whatsapp Web 中抓取所有短信?

转载 作者:行者123 更新时间:2023-12-03 21:23:25 24 4
gpt4 key购买 nike

我一直在尝试使用 Scrapy 进行网络抓取,并且我有兴趣从 Whatsapp 上的所有聊天中检索所有文本消息,以用作机器学习项目的训练数据。我知道有些网站会阻止网络爬虫/抓取工具,所以我想知道是否可以使用 Scrapy 来获取这些消息,如果不可能,我可以使用哪些替代方法?
我知道我可以点击每个聊天的“电子邮件聊天”选项,但是如果我想获取大量数据,不仅来自我自己的聊天,还来自其他愿意让我在项目中使用他们的聊天记录。

最佳答案

我认为 WhatsApp 不会阻止爬虫和抓取工具。您只能访问您的 web.whatsapp.com。您将如何处理您的消息由您决定。当我编写代码来读/写 WhatsApp 消息时,我使用了 Selenium WebDriver,它可以完全自动化任何浏览器操作。它对 WhatsUpp 来说太稳定了。这不是完全自动化,当然是二维码。
如果您按 F12 并转到 Web 浏览器中的“网络”选项卡,您会注意到 XHR 数据包中包含消息。您可以在滚动或打开人员期间加载新消息时看到它。它看起来像字节数据。所以我认为你不能为此编写 Scrapy 代码。

关于web-scraping - 是否可以使用 Scrapy 从 Whatsapp Web 中抓取所有短信?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50775630/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com