gpt4 book ai didi

r - 根据条件对数据帧进行分组并返回整个分组数据帧

转载 作者:行者123 更新时间:2023-12-02 09:29:37 25 4
gpt4 key购买 nike

假设我有以下数据框。第一列是 INPUT,其值例如 4000,4000,3000,2000,2000,2000,2000 等。第二列是组,其值例如 - 1,1,2,3,3,3,3 。分组是根据输入完成的。例如:输入是:-

INPUT     group
4000 1
4000 1
2000 2
3000 3
2000 4
2000 4
2000 4

输出:-返回具有最大重复组值的整个data.frame。

INPUT     group
2000 4
2000 4
2000 4

我的数据框有 10,0000 条记录和 70 个属性。

最佳答案

我们可以使用data.table。我们将“data.frame”转换为“data.table”(setDT(df1)),获取按“group”分组的 nrow 并使用 max 值对行进行子集化“N”。

library(data.table)
setDT(df1)[, N:= .N, group][N==max(N)][, N:= NULL]
# INPUT group
#1: 2000 4
#2: 2000 4
#3: 2000 4

关于r - 根据条件对数据帧进行分组并返回整个分组数据帧,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34507364/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com