gpt4 book ai didi

r - dplyr 按字符串总结

转载 作者:行者123 更新时间:2023-12-02 09:22:49 25 4
gpt4 key购买 nike

我有一个包含数字和字符串值的数据框,例如:

 mydf <- data.frame(id = c(1, 2, 1, 2, 3, 4),
value = c(32, 12, 43, 6, 50, 20),
text = c('A', 'B', 'A', 'B', 'C', 'D'))

id 变量的值始终对应于 text 变量,例如,id == 1 始终为 text == 'A'

现在,我想通过 id (或通过 text,因为它们是同一件事)总结这个数据框:

mydf %>%
group_by(id) %>%
summarize(mean_value = mean(value))

这很好用,但我还需要 text 变量,因为我想进行文本分析。

但是,当我将 text 添加到 dplyr 管道时:

mydf %>%
group_by(id) %>%
summarize(mean_value = mean(value),
text = text)

我收到以下错误:

Error: expecting a single value

由于 idtext 始终相同,是否可以将其附加到汇总数据帧中?

最佳答案

summarize 函数需要对输入应用一些函数,因此我们可以将 text 保留在其中,并将 id 保留在 group_by,或使用 summarize 中的 first 函数:

# text should be in group_by to show up in result
mydf %>%
group_by(id, text) %>%
summarize(mean_value = mean(value))

# or within summarise use first function, to take the first value when grouped
mydf %>%
group_by(id) %>%
summarize(mean_value = mean(value),
text = first(text))

关于r - dplyr 按字符串总结,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40630269/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com