gpt4 book ai didi

api - 我应该使用哪个 Twitter API 来提取大量推文用于 NLP 研究?

转载 作者:行者123 更新时间:2023-12-04 20:14:25 24 4
gpt4 key购买 nike

我想尽可能多地提取包含给定关键字(通常是公司名称)的推文。

我一直在使用 Twitter 搜索 API,但它仅限于“最近的推文”。因此,对于一个相对罕见的关键字,我最多只能获得 500 条推文。

Twitter 说您不应该使用搜索 API 进行研究。那么,我应该使用哪个 API?

最佳答案

要获取大量带有特定关键字的推文,请使用 Streaming APIStatuses/Filter .

首先,创建一个包含 track 条款的文件(例如“tracking.txt”) , 关键字以逗号分隔。这可以包括散列标签。例如,我使用以下方法获取带有链接和特定主题标签的推文。

track=http #baby,http #family,http #children, ...

然后,使用 curl 将流重定向到文件。确保使用您的推特 ID 和密码。

curl -d @tracking.txt https://stream.twitter.com/1/statuses/filter.json -uAnyTwitterUser:Password > stream.json

关于api - 我应该使用哪个 Twitter API 来提取大量推文用于 NLP 研究?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9893150/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com