gpt4 book ai didi

python - 创建一个三维数据框(python)

转载 作者:太空宇宙 更新时间:2023-11-04 11:18:43 25 4
gpt4 key购买 nike

我有一个数据框,其中包含来自一个单元的多年的各种数据点。该单元编号列在我的数据框的第一列中,名为“单元”。年份变量在第二列中。

为了可视化,这是我的数据集的迷你版。实际上是大小:55 列乘以 700000 行。

import random
col3=[random.randrange(1,101,1) for _ in range (14)]
col4=[random.randrange(1,101,1) for _ in range (14)]

d = {'Unit': [1, 1, 1, 1, 2, 2, 2, 3, 4, 5, 6, 6, 6, 6],
'Year': [2014, 2015, 2016, 2017, 2015, 2016, 2017, 2017, 2014, 2015, 2014, 2015, 2016, 2017], 'col3' : col3, 'col4' : col4 }
df = pd.DataFrame(data=d)

通过这个数据集,我想查看一年内和几年之间 col3 和 col4 之间的比率。出于这个原因,我想制作一个三维数据框,它将年份放在一个附加轴上,而不是作为我的 2D 框架中的变量。

有没有人知道如何做到这一点?这是一个好方法吗?有什么建议吗?

最佳答案

因为 Panel现在已弃用,这里是 MultiIndex 的替代方案:

df1 = df.set_index(['Unit','Year']).unstack()
print (df1)
col3 col4
Year 2014 2015 2016 2017 2014 2015 2016 2017
Unit
1 58.0 80.0 37.0 79.0 12.0 32.0 22.0 39.0
2 NaN 90.0 46.0 98.0 NaN 73.0 95.0 28.0
3 NaN NaN NaN 52.0 NaN NaN NaN 90.0
4 90.0 NaN NaN NaN 92.0 NaN NaN NaN
5 NaN 9.0 NaN NaN NaN 3.0 NaN NaN
6 33.0 22.0 41.0 40.0 21.0 5.0 69.0 10.0

df2 = df.set_index(['Year','Unit']).unstack()
print (df2)
col3 col4
Unit 1 2 3 4 5 6 1 2 3 4 5 6
Year
2014 58.0 NaN NaN 90.0 NaN 33.0 12.0 NaN NaN 92.0 NaN 21.0
2015 80.0 90.0 NaN NaN 9.0 22.0 32.0 73.0 NaN NaN 3.0 5.0
2016 37.0 46.0 NaN NaN NaN 41.0 22.0 95.0 NaN NaN NaN 69.0
2017 79.0 98.0 52.0 NaN NaN 40.0 39.0 28.0 90.0 NaN NaN 10.0

另一种方法是使用 xarray .

关于python - 创建一个三维数据框(python),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56460254/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com