gpt4 book ai didi

dataframe - DataFrames.jl 中唯一值组合汇总表

转载 作者:行者123 更新时间:2023-12-03 18:36:11 27 4
gpt4 key购买 nike

我经常想在数据表中找到一些分组变量的独特组合。使用 R + dplyr,我的正常工作流程是组合 groupby(data, var1, var2, var3) %>% summarise ,它返回一个包含 var1var2var3 列的新表,其中 data 中的每个唯一值组合对应一行。
在 DataFrames.jl 中执行此操作的惯用方法是什么?

最佳答案

在 DataFrames.jl 中,DataFrame 是行的集合。所以这里正确的心智模型是首先只选择你关心的列,然后从该表中获取唯一的行,如

select(data, [:var1, :var2, :var3]) |> unique!
(或者,如果你讨厌管道/喜欢额外的括号:
unique!(select(data, [:var1, :var2, :var3]))
此处推荐使用 unique!,因为 select 会复制底层列。或者,您可以使用 View 或索引,但这些需要 unique(它不会改 rebase 础列向量)以免损坏原始数据框:
unique(data[!, [:var1, :var2, :var3]])
unique(view(data, :, [:var1, :var2, :var3]))

关于dataframe - DataFrames.jl 中唯一值组合汇总表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/66142331/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com