gpt4 book ai didi

python - 当一个序列在 df 中的簇中时删除原始数据

转载 作者:行者123 更新时间:2023-12-01 01:14:19 24 4
gpt4 key购买 nike

我有一个数据框,例如:

Cluster sequence_name
1 specie1
1 specie2
1 specie3
1 sequence1
1 sequence2
2 specie8
3 specie2
4 sequence1
4 sequence3
4 specie56
...

我想删除仅包含一个序列的所有簇,在示例中我应该得到:

Cluster sequence_name
1 specie1
1 specie2
1 specie3
1 sequence1
1 sequence2
4 sequence1
4 sequence3
4 specie56
...

感谢您的帮助。

最佳答案

Groupby.filter 在这里效果很好

df = df.groupby('Cluster').filter(lambda x: x.sequence_name.nunique() > 1)

Cluster sequence_name
0 1 specie1
1 1 specie2
2 1 specie3
3 1 sequence1
4 1 sequence2
7 4 sequence1
8 4 sequence3
9 4 specie56

关于python - 当一个序列在 df 中的簇中时删除原始数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54519474/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com