gpt4 book ai didi

R 计算重复项的数量并将其存储到另一列

转载 作者:行者123 更新时间:2023-12-02 20:52:15 24 4
gpt4 key购买 nike

我有一个包含超过 100 000 行的数据集。我想在每行的特定列中查找出现次数并将其保存到另一列(请参见下面的示例)。

我可以迭代整个数据集的每一行,但这将是 100k * 100k 迭代。有没有更有效的方法来做到这一点?

输入数据集

A B
1 6
3 1
2 6
4 2
1 4
9 1

输出数据集

A B number_of_appearances (based on column B)
1 6 2
3 1 2
2 6 2
4 2 1
1 4 1
9 1 2

最佳答案

您可以使用dplyr来实现:

library(dplyr)

a <- c(2,1,2,3,4,3,2,1,4)
b <- c(3,2,1,2,3,4,3,2,1)

df <- data.frame(a, b)

df %>%
group_by(b) %>%
mutate(appearences_in_b = n())

Source: local data frame [9 x 3]
Groups: b [4]

a b appearences_in_b
<dbl> <dbl> <int>
1 2 3 3
2 1 2 3
3 2 1 2
4 3 2 3
5 4 3 3
6 3 4 1
7 2 3 3
8 1 2 3
9 4 1 2

关于R 计算重复项的数量并将其存储到另一列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41910628/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com