gpt4 book ai didi

Python Pandas 数据帧 : How to process a column consisting of dicts into multiple columns determined by the keys of the dicts?

转载 作者:行者123 更新时间:2023-11-30 22:33:17 25 4
gpt4 key购买 nike

在我的一个 pandas DataFrame 中,有一列的每一行都包含一个字典或字典。

例如,其中一行将包含“{'a':1,'b':2}”

我需要创建一个以“a”和“b”作为列的 DataFrame,或者该列中包含的所有字典中有许多唯一键。

例如,如果一行包含“{'a':1,'b':2}”,而另一行包含“{'a':1,'c':2}”,我需要使用以下命令创建一个 DataFrame 'a'、'b' 和 'c' 作为其列。列名将是字典的键,行将包含字典的值。 DataFrame 的索引将与原始索引相同。

谢谢。

最佳答案

我认为您可以使用 DataFrame 构造函数将 data 列转换为 numpy array by values然后到列表:

#borrowing sample from DeepSpace's answer
df = pd.DataFrame({'data': [{'a': 1, 'b': 2}, {'a': 3, 'c': 4}]})
print (df)
data
0 {'a': 1, 'b': 2}
1 {'a': 3, 'c': 4}

df1 = pd.DataFrame(df['data'].values.tolist(), index=df.index)
print (df1)
a b c
0 1 2.0 NaN
1 3 NaN 4.0

关于Python Pandas 数据帧 : How to process a column consisting of dicts into multiple columns determined by the keys of the dicts?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45192130/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com