gpt4 book ai didi

python - 计算数据框列中最常见的值组合

转载 作者:行者123 更新时间:2023-12-04 03:35:40 26 4
gpt4 key购买 nike

我有以下形式的DataFrame:

ID Product
1 A
1 B
2 A
3 A
3 C
3 D
4 A
4 B

我想计算 Product分组的 ID列中两个值的最常见组合。
因此,对于此示例,预期结果将是:
Combination Count
A-B 2
A-C 1
A-D 1
C-D 1

Pandas 有可能输出吗?

最佳答案

使用itertools.combinationsexplodevalue_counts

import itertools

(df.groupby('ID').Product.agg(lambda x: list(itertools.combinations(x,2)))
.explode().str.join('-').value_counts())

Out[611]:
A-B 2
C-D 1
A-D 1
A-C 1
Name: Product, dtype: int64

或者:
import itertools

(df.groupby('ID').Product.agg(lambda x: list(map('-'.join, itertools.combinations(x,2))))
.explode().value_counts())

Out[597]:
A-B 2
C-D 1
A-D 1
A-C 1
Name: Product, dtype: int64

关于python - 计算数据框列中最常见的值组合,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58018049/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com