gpt4 book ai didi

python - 将一系列 dict 和 concat 转换为数据帧

转载 作者:行者123 更新时间:2023-12-01 07:07:20 25 4
gpt4 key购买 nike

我的数据框

                             Items  Count  ScannedCount  
0 {'comp': {'S': '2019-08-02'}... 1032 1032
1 {'comp': {'S': '2019-08-27'}... 1032 1032

项目系列看起来像这样

{'comp': {'S': '2019-08-02T16:54:55.035196+03:00'}, 'ID': {'S': '336'}, 'dID': {'S': '1763523'}, 'fname': {'S': '558012'}}

使用此 post 中的第二个答案允许我将系列转换为数据框。问题是如何扩展该操作,因为它发生在每一行上,

当前方法:

循环每一行并将它们连接成一个系列(非常慢)

item_df = pd.DataFrame(df['Items'].iloc[i]) for i in range(df.shape[0])]).reset_index(drop=True), df], axis=1)

将结果与原始数据框连接

df = pd.concat([temp, df], axis=1)

我相信第一部分中的 for 循环是瓶颈。是否有更快的方法将序列转换为数据帧并将其连接回原始数据帧。

预期输出:

                 comp   ID  dID      fname   Count  ScannedCount  
0 2019-08-02T16:54:55 336 1763523 548012 1032 1032
1 2019-09-01T14:52:24 336 1763523 528012 1032 1032

最佳答案

尝试这个更加柱状的解决方案。它的工作原理是假设字典中始终有“S”键。

df_tmp = df['Items'].apply(pd.Series)
for c in df_tmp.columns:
df[c] = df_tmp[c].apply(lambda x: x.get('S'))
df = df.drop(columns='Items')

关于python - 将一系列 dict 和 concat 转换为数据帧,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58383927/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com