- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我正在使用 Tweepy 流式传输推文,并希望以 CSV 格式记录它们,以便我可以使用它们或稍后将它们加载到数据库中。请记住,我是一个菜鸟,但我确实知道有多种方法可以处理这个问题(非常欢迎提出建议)。
长话短说,我需要将多个 Python 词典转换并附加到一个 CSV 文件中。我已经进行了研究 (How do I write a Python dictionary to a csv file?) 并尝试使用 DictWriter 和 writer 方法进行此操作。
但是,还有一些事情需要完成:
1) 仅将 key 作为 header 写入一次。
2) 随着新推文的流式传输,需要在不覆盖先前行的情况下附加值。
3) 如果值缺失记录NULL。
4) 跳过/修复 ascii 编解码器错误。
这是我希望最终得到的格式(每个值都在其单独的单元格中):
Header1_Key_1 Header2_Key_2 Header3_Key_3...
Row1_Value_1 Row1_Value_2 Row1_Value_3...
Row2_Value_1 Row2_Value_2 Row2_Value_3...
Row3_Value_1 Row3_Value_2 Row3_Value_3...
Row4_Value_1 Row4_Value_2 Row4_Value_3...
这是我的代码:
from tweepy.streaming import StreamListener
from tweepy import OAuthHandler
from tweepy import Stream
import csv
import json
consumer_key="XXXX"
consumer_secret="XXXX"
access_token="XXXX"
access_token_secret="XXXX"
class StdOutListener(StreamListener):
def on_data(self, data):
json_data = json.loads(data)
data_header = json_data.keys()
data_row = json_data.values()
try:
with open('csv_tweet3.csv', 'wb') as f:
w = csv.DictWriter(f, data_header)
w.writeheader(data_header)
w.writerow(json_data)
except BaseException, e:
print 'Something is wrong', str(e)
return True
def on_error(self, status):
print status
if __name__ == '__main__':
l = StdOutListener()
auth = OAuthHandler(consumer_key, consumer_secret)
auth.set_access_token(access_token, access_token_secret)
stream = Stream(auth, l)
stream.filter(track=['world cup'])
提前致谢!
最佳答案
我用 facebook 的图形 API(facepy 模块)做了类似的事情!
from tweepy.streaming import StreamListener
from tweepy import OAuthHandler
from tweepy import Stream
import csv
import json
consumer_key="XXXX"
consumer_secret="XXXX"
access_token="XXXX"
access_token_secret="XXXX"
class StdOutListener(StreamListener):
_headers = None
def __init__(self,headers,*args,**keys):
StreamListener.__init__(self,*args,**keys)
self._headers = headers
def on_data(self, data):
json_data = json.loads(data)
#data_header = json_data.keys()
#data_row = json_data.values()
try:
with open('csv_tweet3.csv', 'ab') as f: # a for append
w = csv.writer(f)
# write!
w.writerow(self._valToStr(json_data[header])
if header in json_data else ''
for header in self._headers)
except Exception, e:
print 'Something is wrong', str(e)
return True
@static_method
def _valToStr(o):
# json returns a set number of datatypes - parse dependingly
# https://docs.python.org/2/library/json.html#encoders-and-decoders
if type(o)==unicode: return self._removeNonASCII(o)
elif type(o)==bool: return str(o)
elif type(o)==None: return ''
elif ...
...
def _removeNonASCII(s):
return ''.join(i if ord(i)<128 else '' for i in s)
def on_error(self, status):
print status
if __name__ == '__main__':
headers = ['look','at','twitter','api',
'to','find','all','possible',
'keys']
# initialize csv file with header info
with open('csv_tweet3.csv', 'wb') as f:
w = csv.writer(headers)
l = StdOutListener(headers)
auth = OAuthHandler(consumer_key, consumer_secret)
auth.set_access_token(access_token, access_token_secret)
stream = Stream(auth, l)
stream.filter(track=['world cup'])
它还没有准备好复制和粘贴,但它足够清晰,您应该能够完成它。
为了提高性能,您可能希望打开文件,写入多条记录,然后关闭文件。这样你就不会一直打开、初始化 csv 编写器、附加然后关闭文件。我不熟悉 tweepy API,所以我不确定它到底是如何工作的 - 但它值得研究。
如果您遇到任何麻烦,我很乐意提供帮助 - 享受吧!
关于python - Writing multiple JSON to CSV in Python - 字典到 CSV,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24155319/
我正在尝试设计我的输入:文件。以下 SO 问题让我完成了 95% 的任务。区别在于我使用的是 HTML5 multiple=multiple 属性。 How to style "input file"
我一直在进行一项实验,其中多个调查参与者使用可穿戴技术聆听多首音乐来跟踪多条信息,两个例子是 BPM(心率)和 T(体温)。 目标是衡量每首音乐(以用户反馈为特征)对人类情感的影响。 目前,所有数据都
我使用 jquery 添加/删除输入 我使用append为日期/收入添加多个Tr 我还使用另一个附加来添加多个 td 以获取同一日期 Tr 中的收入 我添加多个日期输入,并在此表中添加多个收入输入 我
在 Android 中,有一种方法可以为项目中的所有模块生成签名的 APK。例如。我有以下项目 Project -- Library Module -- Module 1 -- Modul
我有一个用于网站展示的系统。 展览数据可能来自差异表中的多个数据。 喜欢这个设计: Table [ExhibitionType] used for differentiate category. Ta
关闭。这个问题是opinion-based .它目前不接受答案。 想要改进这个问题? 更新问题,以便 editing this post 可以用事实和引用来回答它. 关闭 8 年前。 Improve
我正在使用 UILocalnotification...收到通知时,当应用程序处于事件模式时我打开 viewcontroller...但是如果同时收到多个通知...我如何打开多个 viewcontro
我遇到的问题是一个策略浏览器游戏,它有 7 种类型的值。问题如下: 我在 $_POST 中获得了 7 个不同的值,包括从索引 unit_1 到索引 unit_7。这 7 个值是 0 到 20 之间的整
这个问题已经有答案了: Search Large Text File for Thousands of strings (3 个回答) 已关闭10 年前。 我想在多个文件上“grep”多个正则表达式。
我经常对如何在我的应用程序中解决这个问题感到矛盾。我使用了很多选项,包括: 一个通用的多选 - 这是我最不喜欢和最很少使用的选项。我发现可用性非常糟糕,一个简单的误点击就会毁了你所有的辛勤工作。 “自
以下是 couchbase 中的示例文档之一。 { "name":"abc", "friends":["a","b","c"], "bestfriends":["x","y","z"] }
我有 4 张 table 。 表组 | ID | NAME | 1 Premium 2 Silver 表用户 | ID | group_id | NAME | 1
我正在开发一个使用第三方服务(Facebook、Google 等)对用户进行身份验证的应用程序。我为每个用户提供一个内部 ID(uuid v4),该 ID 与他们的第 3 方 ID 相关联。现在,我的
我是 bicep 新手,一直在努力实现 Bicep 脚本来部署具有许多主题和订阅的 Azure 服务总线。 我添加的每个主题都有可变数量的订阅(例如,通知主题可能有 3 个订阅,但分析主题可能有 2
我是 bicep 新手,一直在努力实现 Bicep 脚本来部署具有许多主题和订阅的 Azure 服务总线。 我添加的每个主题都有可变数量的订阅(例如,通知主题可能有 3 个订阅,但分析主题可能有 2
我必须创建一个大型数据库。它将保存来自 100 多个设备的数据,并不断更新数据库。每 10 秒,每个设备都会更新数据库中的一行。是为每个设备数据建立一个单独的表还是将数据与设备 ID 放在同一个表中更
我需要在 Activity 开始时显示“正在加载”进度对话框,然后在加载完成后显示一些内容。在我的 onresume 中,我有类似这样的代码: loadThread = true; Thread sh
我有一个 html 表单 当我提交表单时,假设对于 id = 1,数量为 5 或 对于 id = 3,数量为 8。如何在java脚本或jquery中获取这些值并将这些信息提交到服务器?我
我正在创建一个 Mozilla 扩展程序,通过单击“转换按钮”(标签:转换)将网页内容转换为其他语言它的标签被转换为英文,以便单击该按钮(标签:英文)内容被转换为原始形式 我尝试为每个选项卡设置属性“
我正在尝试根据 进行搜索 我通过运行代码从 select 中获取值: for($i=0;$i= '$age_from' AND users.user_age = '$age_from' AND u
我是一名优秀的程序员,十分优秀!