gpt4 book ai didi

python - 使用 python pandas 如何进行以下分析

转载 作者:行者123 更新时间:2023-11-28 17:06:26 25 4
gpt4 key购买 nike

我有一些村庄的产量数据,样本数据见附件。 enter image description here

Village Yield(in Kg)    Date
Village1 0.22 01/06/18
Village1 0.23 02/06/18
Village1 0.55 01/06/18
Village1 0.2 02/06/18
Village2 0.88 31/05/18
Village2 0.89 30/05/18
Village2 0.63 30/05/18
Village2 0.55 30/05/18

现在,我想证明,villages 相应的产量数据与实验日期。因此,village1 有 4 个产量值。

请看附件。 enter image description here

Village     Yield-1                Yield-2              Yield-3 
Village1 0.22 01/06/18 0.23 02/06/18 0.55 01/06/18

任何帮助都会有所帮助。谢谢

最佳答案

使用:

df = (df.set_index(['Village', df.groupby('Village').cumcount().add(1)])
.unstack()
.sort_index(axis=1, level=1))

df.columns = ['{}-{}'.format(x, y) for x, y in df.columns]
df = df.reset_index()
print (df)
Village Yield(in Kg)-1 Date-1 Yield(in Kg)-2 Date-2 \
0 Village1 0.22 01/06/18 0.23 02/06/18
1 Village2 0.88 31/05/18 0.89 30/05/18

Yield(in Kg)-3 Date-3 Yield(in Kg)-4 Date-4
0 0.55 01/06/18 0.20 02/06/18
1 0.63 30/05/18 0.55 30/05/18

解释:

  1. 第一个set_indexGroupBy.cumcount 创建的组和 unstack reshape
  2. sort_indexMultiIndex 的第二级进行排序
  3. 在具有列表理解的列中展平 Multiindex
  4. 根据 reset_index 的索引创建列

关于python - 使用 python pandas 如何进行以下分析,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50679177/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com