gpt4 book ai didi

dataframe - Julia 。将一列汇总为具有多列的新 DataFrame

转载 作者:行者123 更新时间:2023-12-04 11:29:44 25 4
gpt4 key购买 nike

我需要按一个变量对数据框进行分组,然后通过添加相对于另一个变量的 .25、.5、0.75 分位数的数量或行(我已经可以这样做)和列数对其进行汇总。
在 R 我会做例如:

    iris %>%
group_by(Species) %>%
summarise(
quantile(Sepal.Length, c(.25, .75)) %>%
matrix(nrow = 1) %>%
as.data.frame() %>%
setNames(paste0("Sepal.Length", c(.25, .75)))
)
使用 DataFrames 和 DataFrameMeta 在 Julia 中编写此代码的简洁方法是什么?如果有一个解决方案可以将它一次应用于多个列,那就更好了。
我能在 Julia 中找到的最接近的解决方案是:
groupby(iris, :Species) |>
x -> combine(x, :Sepal.Length => x -> [[map(p -> quantile(x, p), (Q25 = 0.25, Q75 = 0.75))] |> DataFrame])
但它只是将数据帧封装到一个单元格中,而它应该将其分散到多列中。

最佳答案

这是我目前可以建议您的最短时间:

combine(groupby(iris, :Species), :SepalLength => (x -> (quantile(x, [0.25, 0.75]))') => [:q25, :q75])
或类似
combine(groupby(iris, :Species), :SepalLength => (x -> [quantile(x, [0.25, 0.75])]) => [:25, :q75])
或者
combine(groupby(iris, :Species), :SepalLength .=> [x -> quantile(x, q) for q in [0.25, 0.75]] .=> [:q25, :q75])
但即使是你原来的解决方案似乎也比 R 短一点。另外我会把它改写为:
combine(groupby(iris, :Species), :SepalLength => (x -> map(p -> quantile(x, p), (Q25=0.25, Q75=0.75))) => AsTable)
这似乎更清洁。
现在,如果您想处理多个列,您可以这样做(顺便说一句 - 您将如何在 R 中执行此操作?):
combine(groupby(iris, :Species), [n => (x -> (quantile(x, [0.25, 0.75]))') => [n*"_q25", n*"_q75"] 
for n in ["SepalLength", "SepalWidth", "PetalLength", "PetalWidth"]])

关于dataframe - Julia 。将一列汇总为具有多列的新 DataFrame,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/67875478/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com