gpt4 book ai didi

python - 基于列的 Pandas squash 数据框

转载 作者:太空宇宙 更新时间:2023-11-03 12:36:07 25 4
gpt4 key购买 nike

我正在读取一个返回 JSON 的 API我正在使用

from pandas.io.json import json_normalize 
flatten = json_normalize(data['results'])

为了扁平化 JSON,现在的输出就像

                                     breakdowns                 metric                  time         value   
0 [{u'key': u'platform', u'value': u'ios'}] fb_ad_network_imp 2018-08-29T07:00:00+0000 12
1 [{u'key': u'platform', u'value': u'android'}] fb_ad_network_imp 2018-08-29T07:00:00+0000 32
2 [{u'key': u'platform', u'value': u'ios'}] fb_ad_network_request 2018-08-29T07:00:00+0000 33
3 [{u'key': u'platform', u'value': u'android'}] fb_ad_network_request 2018-08-29T07:00:00+0000 132

现在我想根据平台将这 4 行压缩为 2 行,如下所示:

           platform    date         clicks     impressions
0 ios 2018-08-29 33 12
1 android 2018-08-29 132 32

我还映射了这些名称:

fb_ad_network_request -> 点击次数
fb_ad_network_imp -> 展示次数

最好的方法是什么?

最佳答案

您可以在将 dict 展开后使用 pivot_table

dddd['platform']=pd.concat([pd.DataFrame(x) for x in dddd.breakdowns]).value.values
dddd.pivot_table(index=['platform','time'],columns='metric',values='value',aggfunc=sum).reset_index()
Out[237]:
metric platform time fb_ad_network_imp fb_ad_network_request
0 android 2018-08-29 32 132
1 ios 2018-08-29 12 33

关于python - 基于列的 Pandas squash 数据框,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52170676/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com