gpt4 book ai didi

python - 收集推特数据

转载 作者:太空宇宙 更新时间:2023-11-03 18:58:27 25 4
gpt4 key购买 nike

我有一个脚本可以根据存储在 xml 中的 id 获取 twitter 数据,但它并不能获取所有内容。一段时间后,它只会收到空消息。从 2000 个 ID 中,我成功保存了约 200 条推文。知道如何解决这个问题吗?

import xml.etree.ElementTree as xml
import urllib2
import sys

startIter = int(sys.argv[1])
stopIter = int(sys.argv[2])

#Open file to write JSON to
jsonFile = open('jSONfile', 'a')
#Parse XML directly from the file path
tree = xml.parse("twitter.xml")

#Get the root node
rootElement = tree.getroot()

#Loop through nodes in root
iterator = 1
for node in rootElement:
if iterator >= startIter and iterator <= stopIter:
print iterator
print node[0].text
nodeID = node[0].text
try:
tweet = urllib2.urlopen('https://api.twitter.com/1/statuses/show.json?id={0}&include_entities=true'.format(nodeID))
tweetData = tweet.read()
print tweetData
jsonFile.write('{0}\n'.format(tweetData).',')
except:
pass
iterator = iterator + 1
jsonFile.close()

最佳答案

Twitter API 有严格的 API 限制。他们限制 API。如果您经常访问他们的 API,他们很可能会永久或在固定的时间内停止向您提供内容。要了解到底有哪些限制,请查看 API Rate LimitingRate limits

Twitter 自己也承认,他们必须处理的普通 API 的数据量大约占实际传入数据的 1%。如果您想要特定 API 类型的整个数据集,那么您需要访问他们的Twitter Firehouse API。

关于python - 收集推特数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16690488/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com