- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有一个有很多列的框架c1 c2 c3 c4 ... c30 d
我想聚合并找到 c1..30 中唯一的所有行,然后获取该行的 min(d)。在 sql 中,这将是一个由 c1, ..., c30 组成的组。
d 是日期类型。
我在堆栈中找到了一些解决方案,但似乎没有一个适用于 1) 如此多的列 2) 计算 min 而不是求和。
任何输入都会很棒。
最佳答案
这是使用 data.table
的答案包含一些假数据的包:
library(data.table)
DT<-data.table(matrix(sample(1:2,3000,replace=TRUE),ncol=30))
DT2<-DT[sample(seq_len(nrow(DT)),9000,replace=TRUE)]
# EDIT: now "d" is a date.
DT2[,d:=as.POSIXct(origin = "1960-01-01",rnorm(nrow(DT2), sd = 1000))]
setnames(DT2,c(paste0("c",1:30),"d"))
## pick up herewith your own data, starting with the commented next line
# DT2 <- as.data.table(dataset)
setkeyv(DT2,paste0("c",1:30))
DT3<-DT2[,list(minD=min(d)),by=key(DT2)]
dim(DT2)
# [1] 9000 31
dim(DT3)
# [1] 100 31
Matthew 的小补充:
+10,以及漂亮的假数据。首先设置一个 key ,这样你就可以做 by=key(DT)
有时会有点繁琐,所以为了简单起见,我通常会为这样的事情做一个临时的。但是,首先尝试最自然的事情:
DT2[,min(d),by=paste0("c",1:30)]
Error in `[.data.table`(DT2, , min(d), by = paste0("c", 1:30)) :
'by' appears to evaluate to column names but isn't c() or key(). Use by=
list(...) if you can. Otherwise, by=eval(paste0("c", 1:30)) should work.
This is for efficiency so data.table can detect which columns are needed.
错误信息告诉我们需要做什么:
ans = DT2[,min(d),by=eval(paste0("c",1:30))]
dim(ans)
[1] 100 31
下一个自然的想法当然是:好吧,如果 data.table 足够聪明,知道 by
是列名并将其放在错误消息中,为什么不能这样做呢?答案是它只是根据数据进行猜测。在某些边缘情况下,它不是很清楚。所以目前需要用户的额外意图:用 eval
包装.不过,我对此并不完全满意,所以也许我们可以改进这一点。
编辑:重命名新的 data.table
在我的方法中,我将新列命名为 minD
当我通过输入
DT3<-DT2[,list(minD=min(d)),by=key(DT2)]
使用 Matthew Dowle 的方法,您可以通过输入以几乎相同的方式实现此目的
ans = DT2[,list(minD=min(d)),by=eval(paste0("c",1:30))]
如果您已经创建了该列并想重命名它,请使用 setnames
如下:
setnames(DT3,old="minD",new="theNewMinD")
这避免了复制整个 data.table
并在分配时保留内存(使用 names(DT3)<-"something"
时这两个优点都会丢失),如 ?setnames
下的文档中所述
关于r - "group by"类似于 R 中的命令,以 min 作为聚合函数和多列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11349741/
我正在尝试模拟 Max-Min 和 Min-Min 调度算法,并在模拟中自己编写代码。但是不太了解如何在代码中实现它们的工作方式。 例如,在 FCFS 算法中我使用了 3 个服务器 (vms),每个服
有人可以帮我实现这个功能吗?此功能位于相机应用程序内部,该应用程序使用过滤算法来检测颜色变化等方面的差异。语法对我来说非常困难。我不知道如何处理参数中的指针、最小和最大变量语法、什么是增量等?有人可以
我遇到如图所示的表数据情况,我想从每个唯一成员中选择 min(code) 和 secondary_min(code) 。 即期望的输出看起来像 member | min(code) | s
我有一个查询,选择每小时的最小值: SELECT MIN(price), HOUR(timestamp), DATE(timestamp) FROM `scan` GROUP BY DATE(time
#include int min(int pArray[], int nrOfArrayElements) { min = pArray[0]; for (int i = 1; i
generate(vec.begin(), vec.end(), [=](){return static_cast(static_cast(ran()) /RAND_MAX*(max-min)+min
当 min 已经被定义为宏时,如何调用 std::min? 最佳答案 (std::min)(x,y) min 周围的括号防止宏扩展。这适用于所有函数宏。 关于c++ - 当 min 被定义为宏时如何调
我正在尝试对(几个)SQL 数据库中的现有数据负载进行一些转换分析。 数据结构本身非常简单。它只是一个 Actor 列表(比如 user_id)和他们所做的事情的名称。它看起来像这样(还有其他数据,但
我正在尝试根据浏览器的最小高度和最小宽度更改我页面上的 CSS,所以我正在使用它: @media (min-height: 500px), (min-width: 580px) { /* CSS
我有两张 table 。第一个表显示 id_product 和 Product_price_value。下面我将向您展示一个示例(在我的数据库中有很多行) 表:主产品 ID_product: prod
我有两个表:商品和价格(一对多) 每个项目都有一个默认价格,但是这个价格可以在第二个表中被覆盖(在某些情况下)。 首先,我在获取所有项目并预先计算最低价格 - 默认价格与其覆盖当前价格(如果有的话?)
我使用以下命令用 pandas 读取了此 Excel 工作表(仅“DATEHEUREMAX”列): xdata = read_excel('Data.xlsx', 'Data', usecols=['
我想了解min-max堆删除的过程是如何工作的,我已经搜索了它的伪代码但一无所获,而且我似乎不能在这里询问伪代码。所以这是我的问题 谁能展示“删除最小元素 7”的逻辑,至少让我知道伪代码“感觉如何”?
将 std::min 传递给函数不会编译。我将 std::min 的 libcpp 声明复制到我的源文件中并且它有效。 std 版本有什么问题? clang 和 gcc 也是如此。在 Godbolt
请看这个例子:http://jsfiddle.net/vrgT3/5/ 我用 overflow: auto; 创建了一个 250x250px 父 div,因此当内容溢出框时会出现滚动条。我设置了蓝色背
假设我有 4 个变量 a、b、x、y和一个约束 min(a,b) > min(x,y)。 我如何在 pulp python 中表示这个程序? 最佳答案 好的。所以,我发布(删除)的第一个答案有点仓促,
我刚刚经历了 THIS fiddle 和代码如下所示: 现在,当我使用 View 框并将值更改为 viewbox="100 100 225 225" 时它具有执行以下操作的效果
我有 minSdkVersion 16,我想搜索正确的支持库以便使用方法 setActionBar()(在 api 级别 21 中引入)。 我应该使用哪个 appcompat 版本?当然,我不想使用旧
bootstrap.min.css 和 bootstrap.min.js 有什么区别?为什么需要包含 bootstrap.min.js? 和 最佳答案 它们都是完整 Bootstrap 样式 (C
我是一名优秀的程序员,十分优秀!