gpt4 book ai didi

python - Pandas DataFrame 中的编号组

转载 作者:太空宇宙 更新时间:2023-11-03 17:18:08 27 4
gpt4 key购买 nike

Pandas 中有没有一种方法可以根据列值对 DataFrame 中的组进行编号?如果我的框架看起来像这样

  Column1 Column2  Column3
0 A X 23
1 A X 45
2 A Y 32
3 A Y 53
4 A Y 67
5 B X 85
6 B Y 12
7 B Y 94

我希望能够做的事情是这样的

df.group_numbers(['Column1', 'Column2'])

Column1 Column2 Column3 GroupNumber
0 A X 23 1
1 A X 45 1
2 A Y 32 2
3 A Y 53 2
4 A Y 67 2
5 B X 85 3
6 B Y 12 4
7 B Y 94 4

最佳答案

正如ajcr评论中所建议的,pd.factorize是正确的选择。在您的情况下,您可以通过添加两列并在其间添加一些分隔符来添加两列以快速创建键数组。分隔符是为了避免混淆,如 DSM 建议的 ab, ca, bc

df['GroupNumber'] = pd.factorize(df.Column1 + ' ' + df.Column2) 

它仍然比使用 pd.lib.fast_zip 更快。

关于python - Pandas DataFrame 中的编号组,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33443897/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com