gpt4 book ai didi

python - 从 Pandas Column 中解压字典

转载 作者:太空狗 更新时间:2023-10-30 02:37:19 25 4
gpt4 key购买 nike

我有一个数据框,其中一列作为字典。我想将它解压成多个列(即代码、数量是下面原始列格式中的单独列)。以下代码用于使用 pandas v0.22,现在 (0.23) 给出索引错误:

pd.DataFrame.from_records(df.col_name.fillna(pd.Series([{'code':'not applicable'}], index=df.index)).values.tolist())

ValueError: Length of passed values is 1, index implies x

我在 google/stack overflow 上搜索了几个小时,但之前提供的其他解决方案都不再有效。

原始列格式:

     dict_codes
0 {'code': 'xx', 'amount': '10.00',...
1 {'code': 'yy', 'amount': '20.00'...
2 {'code': 'bb', 'amount': '30.00'...
3 {'code': 'aa', 'amount': '40.00'...
10 {'code': 'zz', 'amount': '50.00'...
11 NaN
12 NaN
13 NaN

有人有什么建议吗?

谢谢

最佳答案

设置

df = pd.DataFrame(dict(
codes=[
{'amount': 12, 'code': 'a'},
{'amount': 19, 'code': 'x'},
{'amount': 37, 'code': 'm'},
np.nan,
np.nan,
np.nan,
]
))

df

codes
0 {'amount': 12, 'code': 'a'}
1 {'amount': 19, 'code': 'x'}
2 {'amount': 37, 'code': 'm'}
3 NaN
4 NaN
5 NaN

应用 pd.Series

确保先dropna

df.codes.dropna().apply(pd.Series)

amount code
0 12 a
1 19 x
2 37 m

df.drop('codes', 1).assign(**df.codes.dropna().apply(pd.Series))

amount code
0 12.0 a
1 19.0 x
2 37.0 m
3 NaN NaN
4 NaN NaN
5 NaN NaN

tolistfrom_records

相同的想法,但跳过了apply

pd.DataFrame.from_records(df.codes.dropna().tolist())

amount code
0 12 a
1 19 x
2 37 m

df.drop('codes', 1).assign(**pd.DataFrame.from_records(df.codes.dropna().tolist()))

amount code
0 12.0 a
1 19.0 x
2 37.0 m
3 NaN NaN
4 NaN NaN
5 NaN NaN

关于python - 从 Pandas Column 中解压字典,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50512188/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com