gpt4 book ai didi

python - Pandas:如何从现有列下的列表列表中插入新数据?

转载 作者:太空宇宙 更新时间:2023-11-03 21:17:23 26 4
gpt4 key购买 nike

因此,我有一个空的 pandas 数据框,我计划将其追加多次,并为其指定列

dataframe = pd.DataFrame([], columns=['Author', 'Date', 'Text', 'Length', 'Favorites', 'Retweets'])

最终,我拥有列表列表(或数组数组,如果您愿意的话)形式的数据,并且希望将其全部添加到当前列下的空数据框中。

数据是这样生成的,(我正在从 Twitter 上抓取数据,顺便说一句)

input = np.array(list(zip([tweet.source for tweet in tweets],
[tweet.created_at for tweet in tweets],
[tweet.text for tweet in tweets],
[len(tweet.text) for tweet in tweets],
[tweet.favorite_count for tweet in tweets],
[tweet.retweet_count for tweet in tweets])))

这会生成一个数组,其中每个项目对应一条推文以及与其相关的所有信息。

如果我尝试dataframe.append(pd.DataFrame(input)),我会得到以下困惑的结果,

enter image description here

在这种情况下,我如何有效地将这些数据 append 到我的数据框中?

提前谢谢大家。

最佳答案

您可以做的一件事是创建如下数据:

input = np.array([[tweet.source, tweet.created_at, tweet.text, 
len(tweet.text), tweet.favorite_count, tweet.retweet_count]
for tweet in tweets])

这样,您只需迭代一次 tweet 数组即可构建矩阵,然后可以将其提供给 pandas:

dataframe = pd.DataFrame(input, columns=['Author', 'Date', 'Text', 'Length', 
'Favorites', 'Retweets'])

一次性构建所有数据,然后围绕其构建 pandas 数据框,比将每个观察结果 append 到数据框要高效得多。

如果您打算采用分桶方法,我建议您使用上述方法构建数据帧列表,然后使用 pd.concat

df_total = pd.concat([df1, df2, ... dfn])

或者,如果您刚刚收到新批处理,您可以尝试:

df = pd.concat([df, df_new_batch])

链接到 pd.concat 的文档

关于python - Pandas:如何从现有列下的列表列表中插入新数据?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54586058/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com