gpt4 book ai didi

r - 组内组合的总和值

转载 作者:行者123 更新时间:2023-12-02 00:09:20 25 4
gpt4 key购买 nike

为了进行分析,我想将 data 从:

data <- data.frame(
Customer = c("A", "A", "B", "B", "C", "C", "C"),
Product = c("X", "Y", "X", "Z", "X", "Y", "Z"),
Value = c(10, 15, 5, 10, 20, 5, 10)
)
data
# Customer Product Value
# 1 A X 10
# 2 A Y 15
# 3 B X 5
# 4 B Z 10
# 5 C X 20
# 6 C Y 5
# 7 C Z 10

收件人:

Product Product Sum Value
-------|-------|---------
X |Y |50
X |Z |45
Y |Z |15

基本上,我想获得客户中每个产品组合的值(value)总和。我想它可以在 reshape 包的帮助下工作,但我无法让它工作。

感谢您的宝贵时间。

最佳答案

这是一种方法,分为两步:

1) 将您的数据转换为客户中所有对的长数据框。为此,我依靠 combn 来提供所有可能对的索引:

process.one <- function(x) {
n <- nrow(x)
i <- combn(n, 2)
data.frame(Product1 = x$Product[i[1, ]],
Product2 = x$Product[i[2, ]],
Value = x$Value[i[1, ]] +
x$Value[i[2, ]])
}

library(plyr)
long <- ddply(data, "Customer", process.one)
long
# Customer Product1 Product2 Value
# 1 A X Y 25
# 2 B X Z 15
# 3 C X Y 25
# 4 C X Z 30
# 5 C Y Z 15

2) 删除 Customer 维度并汇总您的值:

aggregate(Value ~ ., long[c("Product1", "Product2", "Value")], sum)
# Product1 Product2 Value
# 1 X Y 50
# 2 X Z 45
# 3 Y Z 15

关于r - 组内组合的总和值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16335763/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com