gpt4 book ai didi

基于R中字段的运行计数

转载 作者:行者123 更新时间:2023-12-04 05:17:30 25 4
gpt4 key购买 nike

我有这种格式的数据集

User       
1
2
3
2
3
1
1

现在,我想添加一列count来计数用户的出现。我想要以以下格式输出。
User    Count
1 1
2 1
3 1
2 2
3 2
1 2
1 3

我的解决方案很少,但是所有这些解决方案都有些慢。

Running count variable in R

我的data.frame现在有100,000行,很快就可能达到100万行。我需要一个也很快的解决方案。

最佳答案

您可以从我的“splitstackshape”包中使用getanID:

library(splitstackshape)
getanID(mydf, "User")
## User .id
## 1: 1 1
## 2: 2 1
## 3: 3 1
## 4: 2 2
## 5: 3 2
## 6: 1 2
## 7: 1 3

本质上,这是使用“data.table”的方法,看起来类似于以下内容:
as.data.table(mydf)[, count := seq(.N), by = "User"][]

关于基于R中字段的运行计数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31259932/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com