- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我经常想在数据表中找到一些分组变量的独特组合。使用 R + dplyr,我的正常工作流程是组合 groupby(data, var1, var2, var3) %>% summarise
,它返回一个包含 var1
、 var2
、 var3
列的新表,其中 data
中的每个唯一值组合对应一行。
在 DataFrames.jl 中执行此操作的惯用方法是什么?
最佳答案
在 DataFrames.jl 中,DataFrame 是行的集合。所以这里正确的心智模型是首先只选择你关心的列,然后从该表中获取唯一的行,如
select(data, [:var1, :var2, :var3]) |> unique!
(或者,如果你讨厌管道/喜欢额外的括号:
unique!(select(data, [:var1, :var2, :var3]))
此处推荐使用
unique!
,因为
select
会复制底层列。或者,您可以使用 View 或索引,但这些需要
unique
(它不会改 rebase 础列向量)以免损坏原始数据框:
unique(data[!, [:var1, :var2, :var3]])
unique(view(data, :, [:var1, :var2, :var3]))
关于dataframe - DataFrames.jl 中唯一值组合汇总表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/66142331/
我的数据库中有 4 个表。 2012,2013,2014,2015. 每一个都是这样布置的: 我想对每年的每个 StartStation 求和: StartStation 2012
您建议使用哪种方法,为什么? 创建汇总表和 . . . 1) 实时更新表格。 2) 每 15 分钟运行一次 group by 查询以更新汇总表。 3) 还有别的吗? 数据必须接近实时,不能等一个小时、
我正在尝试使用来自 python 的 pandas 的 .describe() 创建一个汇总表。 我有以下数据框: df = pd.DataFrame({'Group':['Group1', 'Gro
我在 pandas 中得到了下表: x 是 1 1 2 3 2 5 2 4 1 4 1 5 我想看看变量x的模式,所以我想看看模式是什么。 在表格中,您会看到 x=1 然后 x=2 三次,然后返回
我有一个数据库,其中有许多具有关系的表中的数据 TABLE Cars (stock) --------------------- Model colourid Doors --------
我正在尝试对列表求和,但跳过第一个偶数,然后继续添加列表的其余部分,包括其余的偶数,但我似乎不太正确。 list = [-3, -7, -1, 0, 1, 2, 3, 4, 5, 6, 7] def
我正在开发一个我需要创建和维护的项目 汇总表 出于性能原因。我相信正确的术语是 物化 View . 我有两个主要原因这样做: 非规范化 我尽可能地对表格进行了标准化。所以在某些情况下,我必须加入许多表
我有两个表,表 A 有列 token(主键)和 停机时间(INT),表 B 有列 token, status(ENUM 有 3 种状态:active, unstable, inactive ), du
我正在使用包 purrr 和 broom 来生成一系列 glm 并构建一个包含模型信息的表格,以便我可以比较它们。 当我从 purrr 调用 map 函数时,代码失败。我认为问题与 mutate 和
我是一名优秀的程序员,十分优秀!