gpt4 book ai didi

r - 使用 multidplyr 时如何按多列拆分

转载 作者:行者123 更新时间:2023-12-02 02:58:30 24 4
gpt4 key购买 nike

tl;dr
如何从多个列的乘法器拆分中进行“分区”?

动机:
我对使用 32 个内核中的 1 个内核进行辛勤总结感到不满意,所以我尝试使用 multi-dplyer我正在对多个列进行操作。

示例:
小插图显示按单个列分组,但当我这样做时,不考虑我的其他分组列。

代码:

library(dplyr)
library(multidplyr)
library(nycflights13)

flights1 <- partition(flights, flight)
flights2 <- summarise(flights1, dep_delay = mean(dep_delay, na.rm = TRUE))
flights3 <- collect(flights2)

那么按年、月、日拆分怎么样?

这对我不起作用:

flights1 <- partition(flights, list(year, month, day))
flights2 <- summarise(flights1, dep_delay = mean(dep_delay, na.rm = TRUE))
flights3 <- collect(flights2)

我似乎无法完成这项工作。您能否指出一种适当的或至少有效的方法来做到这一点?

最佳答案

根据?partitionpartition的用法是

partition(.data, ..., cluster = get_default_cluster())

其中 ... 是分区依据的变量。不是传入变量列表,而是分别传入每个变量,即

partition(flights, year, month, day)

关于r - 使用 multidplyr 时如何按多列拆分,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47928910/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com