gpt4 book ai didi

Python:将 Tweet unicode 数据导入 pandas 数据框对象

转载 作者:太空宇宙 更新时间:2023-11-03 11:31:56 24 4
gpt4 key购买 nike

我正在尝试导入具有以下结构的文件(推文转储,带有 unicode 字符串)。目标是使用 pandas 模块将其转换为 DataFrame。我假设第一步是加载到一个 json 对象,然后转换为一个 DataFrame(根据 McKinney 的 Python for Data Analysis 一书的第 166 页)但我不确定并且可以使用一些指针来管理它。

import sys, tailer
tweet_sample = tailer.head(open(r'<MyFilePath>\usTweets0.json'), 3)
tweet_sample # returns
['{u\'contributors\': None, u\'truncated\': False, u\'text\': u\'@KREAYSHAWN is...

最佳答案

只需使用 DataFrame 构造函数...

In [6]: tweet_sample = [{'contributers': None, 'truncated': False, 'text': 'foo'}, {'contributers': None, 'truncated': True, 'text': 'bar'}]

In [7]: df = pd.DataFrame(tweet_sample)

In [8]: df
Out[8]:
contributers text truncated
0 None foo False
1 None bar True

如果你有一个 JSON 格式的文件,你可以使用 json.load 打开它:

import json
with open('<MyFilePath>\usTweets0.json', 'r') as f:
tweet_sample = json.load(f)

将会有一个 from_jsonsoon对 Pandas ...

关于Python:将 Tweet unicode 数据导入 pandas 数据框对象,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16966494/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com