- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有一个相当大的数据框,我需要一种好的方法(波纹管说明)来提取在一组特定标签内具有给定字段最大值的行的索引。为了更好地说明这一点,下面是一个示例的10行数据帧:
value label
1 5.531637 D
2 5.826498 A
3 8.866210 A
4 1.387978 C
5 8.128505 C
6 7.391311 B
7 1.829392 A
8 4.373273 D
9 7.380244 A
10 6.157304 D
structure(list(value = c(5.531637, 5.826498, 8.86621, 1.387978, 8.128505,
7.391311, 1.829392, 4.373273, 7.380244, 6.157304),
label = c("D", "A", "A", "C", "C", "B", "A", "D", "A", "D")),
.Names = c("value", "label"), class = "data.frame", row.names = c(NA, -10L))
idx <- sapply(split(1:nrow(d), d$label), function(x) {
x[which.max(d[x,"value"])]
})
A B C D
3 6 5 10
ddply
,但还没有找到更好的方法来做到这一点。在这种情况下,“更好”的意思是速度更快(
ddply
相当慢,我目前使用的语言也不落后),并且也更优雅,因为上述解决方案似乎也太罗word了。
最佳答案
首先:您可以使用以下方法加快速度:
idx <- sapply(split(seq_len(nrow(d)), d$label), function(x) {
x[which.max(d$value[x])]})
data.frame
,在我的机器上,它比
d[x,"value"]
版本快5倍。
data.frame
和许多标签,您可以使用与
I posted in earlier question类似的方法:
dd <- d[i<-order(d$label, d$value),] # dd is sorted by label and value
ind <- c(dd$label[-1] != dd$label[-n], TRUE)
idx <- setNames(seq_len(nrow(d))[i][ind], dd$label[ind])
v <- d$label[i<-order(d$value)] # we need only label, and with Martin
# trick sorting over label is not needed
ind <- !duplicated(v, fromLast=TRUE) # it finds last (max) occurrence of label
idx <- setNames(seq_len(nrow(d))[i][ind], v[ind])
# NOTE: different machine, so timing differ from previous
set.seed(6025051)
n <- 100000; k <- 20000
d <- data.frame(value=rnorm(n),
label=sample(paste("A",seq_len(k),sep="_"), n, replace=TRUE))
system.time(
idx_1 <- sapply(split(1:nrow(d), d$label), function(x) {
x[which.max(d[x,"value"])]})
)
# user system elapsed
# 1.30 0.02 1.31
system.time(
idx_1b <- sapply(split(seq_len(nrow(d)), d$label), function(x) {
x[which.max(d$value[x])]})
)
# user system elapsed
# 0.23 0.00 0.23
all.equal(idx_1, idx_1b)
# [1] TRUE
system.time({
dd <- d[i<-order(d$label, d$value),]
ind <- c(dd$label[-1] != dd$label[-n], TRUE)
idx_2 <- setNames(seq_len(nrow(d))[i][ind],dd$label[ind])
})
# user system elapsed
# 0.19 0.00 0.19
all.equal(idx_1, idx_2)
# [1] TRUE
system.time({
v <- d$label[i<-order(d$value)]
ind <- !duplicated(v, fromLast=TRUE)
idx_3 <- setNames(seq_len(nrow(d))[i][ind], v[ind])
})
# user system elapsed
# 0.05 0.00 0.04
all.equal(sort(idx_1), sort(idx_3))
# [1] TRUE
关于r - 为命名字段具有MAX值的数据框行提取索引,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6025051/
快速且可能简单的 Lambda 问题: 我有一家有评论的餐厅。我想查询具有以下内容的那个: 最大(平均评分) 和 Max(ReviewCount) 和 Max(NewestReviewDate) 和
在尝试使用 C++17 折叠表达式时,我尝试实现 max sizeof ,其中结果是类型 sizeof 的最大值。我有一个使用变量和 lambda 的丑陋折叠版本,但我想不出一种使用折叠表达式和 st
我目前正在使用 C 并遇到了一些我觉得有趣的东西,但似乎在这里找不到任何类似的东西。 我正在为数组(大小 1000000)静态分配内存。我知道这相当大并且有可能引起问题。但是,使用 10^6 不会出现
我有一个具有 max-height 的 div 和其中的图像,应该使用 max-width:100% 和 max-height:100%。在 Chromium 中,这是可行的,但 Firefox 仅使
我有一个最大高度的 div 和里面的一个图像,它应该使用最大宽度:100% 和最大高度:100%。在 Chromium 中,这是可行的,但 Firefox 仅使用最大宽度而忽略最大高度。 div#ov
在一本在线 awk 手册中我找到了例子awk '{ if (NF > max) max = NF } END { print max }' 该程序打印任何输入行上的最大字段数。但我不明白 awk 如何
按照目前的情况,这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持,但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visit the
我正在制作一个非循环图数据库。 表 Material (id_item,id_collection,...)主键(id_item,id_collection) (item可以是collection本身
我有以下两个表。 1.电影详情(电影ID、电影名称、评分、票数、年份) 2.电影类型(Movie-ID,Genre) 我正在使用以下查询来执行连接并获得每个评分最高的电影流派。 select Movi
我有一个查询,我想返回 idevent 中给定传感器 ID (sensorID) 范围内的最高 ID 值,但是查询没有返回最高值。 我运行查询时减去 max() 语句的结果: mysql> SELEC
SUM(MAX() + MAX()) 有正确的方法吗? 这是我一直在努力做的事情 SELECT SUM(MAX(account.BALANCE1) + MAX(account.BALANCE2))
这个问题类似于CSS media queries: max-width OR max-height , 但由于我的代表不够高,我无法在回复中添加评论(问题),我想在原始问题中添加。 与其他主题中的发帖
Jon Skeet今天报告(source): Math.Max(1f, float.NaN) == NaN new[] { 1f, float.NaN }.Max() == 1f 为什么? 编辑:双倍
这个问题已经有答案了: Java 8 stream's .min() and .max(): why does this compile? (5 个回答) 已关闭 7 年前。 我正在学习1z0-809
我在处理一些数据库记录时遇到了一些挑战。 我需要为特定列获取具有 MAX 值的行,并且这些记录必须介于两个时间戳值之间。 这是SQL查询 SELECT id, MAX(amount), created
我想在媒体查询中使用 AND 条件。我使用了下面的代码,但是没有用 @media screen and (max-width: 995px AND max-height: 700px) { } 最佳答
在编写 CSS 媒体查询时,有什么方法可以用“或”逻辑指定多个条件吗? 我正在尝试做这样的事情: /* This doesn't work */ @media screen and (max-widt
我对仅使用 max(list array) 和 np.max(list array) 之间的区别有疑问。 这里唯一的区别是 Python 返回代码所需的时间吗? 最佳答案 它们在边缘情况下可能不同,例
例如: a = [[0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0], [0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.
这个问题在这里已经有了答案: Java 8 stream's .min() and .max(): why does this compile? (5 个答案) 关闭 6 年前。 我正在学习 1z0
我是一名优秀的程序员,十分优秀!