gpt4 book ai didi

数据框中的 Pandas 聚合计数

转载 作者:行者123 更新时间:2023-12-02 06:29:51 24 4
gpt4 key购买 nike

我有一个 DataFrame 并且我正在使用 .aggregate({'col1': np.sum}) ,这将对 col1 中的值进行求和并将它们聚合在一起。是否可以执行计数,例如 .aggregate({'col1': some count function here})

最佳答案

您可以根据您的用例使用 'size''count''nunique' 。它们之间的区别在于:

  • 'size' : 包括 NaN 和重复值的计数。
  • 'count' :不包括 NaN 但包括重复的计数。
  • 'nunique' :唯一值的计数,不包括重复和 NaN

  • 例如,考虑以下 DataFrame:
    df = pd.DataFrame({'col0': list('aabbcc'), 'col1': [1, 1, 2, np.nan, 3, 4]})

    col0 col1
    0 a 1.0
    1 a 1.0
    2 b 2.0
    3 b NaN
    4 c 3.0
    5 c 4.0

    然后使用描述的三个函数:
    df.groupby('col0')['col1'].agg(['size', 'count', 'nunique'])

    size count nunique
    col0
    a 2 2 1
    b 2 1 1
    c 2 2 2

    关于数据框中的 Pandas 聚合计数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41682240/

    24 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com