- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我在将这个问题的逻辑与 dplyr
的逻辑匹配时遇到了一些麻烦。通常,如果您想将一个组减少到每组一个数字,您可以使用 summarise
,而如果您想为每一行计算一个单独的数字,您可以使用 mutate
。但是如果你想对每行的组进行计算呢?
在下面的示例中, mloc
包含一个指向 pnum
的指针,目标是添加一个新列 nm_child
,该列对于每一行,计算组中指向(即具有相同值)该行的 mloc
值的数量pnum 中的组内索引。使用嵌套循环或 map
很容易做到这一点,如果我知道如何为每个组迭代 1),& 2) 通过每个元素,& 3) 将 map 输出作为组中的列返回。
library(tidyverse)
ser <- c(1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2)
pnum <- c(1:5, 1:6)
mloc <- c(0, 2, 2, 0, 3, 1, 1, 0, 0, 3, 4)
tb1 <- tibble(ser,pnum, mloc)
tb2 <- tb1 %>%
group_by(ser) %>%
mutate(nm_child = sum(pnum == mloc))
nm_child
总是 = 1。我明白为什么它不起作用,但我不明白它为什么这样做。
mutate(nm_child = count(pnum == mloc))
no applicable method for 'groups' applied to an object of class "logical")
tb2$nm_child = c(0, 2, 1, 0, 0, 2, 0, 1, 1, 0, 0)
最佳答案
您可以使用 outer
和 rowSums
tb1 %>%
group_by(ser) %>%
mutate(nm_child = rowSums(outer(pnum, mloc, `==`)))
# # A tibble: 11 x 4
# # Groups: ser [2]
# ser pnum mloc nm_child
# <dbl> <int> <dbl> <dbl>
# 1 1 1 0 0
# 2 1 2 2 2
# 3 1 3 2 1
# 4 1 4 0 0
# 5 1 5 3 0
# 6 2 1 1 2
# 7 2 2 1 0
# 8 2 3 0 1
# 9 2 4 0 1
# 10 2 5 3 0
# 11 2 6 4 0
tb1 <- tb1[rep(1:11,5e4),]
tb1$ser <- rep(1:1e5, rep(5:6,5e4))
tb2 <- as.data.table(tb1)
library(microbenchmark)
microbenchmark(
sapply = {
tb1 %>%
group_by(ser) %>%
mutate(
nm_child = sapply(pnum, function(x) sum(x == mloc))
)
},
join = {
tb1 %>%
group_by(ser, mloc) %>%
summarise(nm_child=n()) %>%
left_join(tb1, ., by=c("ser"="ser","pnum"="mloc"))
},
outer1 = {
tb1 %>%
group_by(ser) %>%
mutate(nm_child = rowSums(outer(pnum, mloc, `==`)))
},
outer2 = {
tb1 %>%
group_by(ser) %>%
mutate(nm_child = colSums(outer(mloc, pnum, `==`)))
},
data.table = {
tb2[tb2[, .N, by=.(ser,mloc)], on=c("ser","pnum"="mloc"), nm_child := N][]
},
times = 10)
# Unit: milliseconds
# expr min lq mean median uq max neval
# sapply 8233.5740 8297.7331 8939.9369 8647.5935 8956.3364 10706.3362 10
# join 889.6682 899.0483 935.7493 908.1441 932.2827 1135.8424 10
# outer1 4551.0428 4631.1605 5184.9359 4986.7327 5160.0109 7563.4190 10
# outer2 4495.9134 4552.1169 4763.5954 4723.7783 4893.2190 5198.4556 10
# data.table 108.7449 115.7866 124.4453 120.6742 125.7591 171.8111 10
关于r - 涉及行特定和整组元素的组特定计算,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56138283/
这个问题不太可能对任何 future 的访客有帮助;它只与一个较小的地理区域、一个特定的时间点或一个非常狭窄的情况相关,通常不适用于全世界的互联网受众。如需帮助使此问题更广泛适用,visit the
我有一个在 ab 时间内运行的算法,其中 a 和 b 都是单独的输入。 我的算法还是多项式时间复杂度算法还是nn?我认为 nn 不是多项式,但我仍然不确定。 我看到 n 算法的阶乘仍然评估为 nn 复
这个问题在这里已经有了答案: Logical operators (AND, OR) with NA, TRUE and FALSE (2 个回答) 1年前关闭。 由于“is.na(NA)”返回真,“
假设我有一个具有以下结构的 Pandas 数据框: df = pd.DataFrame(dict(a=["x", "x", "y"], b=[0, 1, 1], c=[1, 2, 2])) 我想按 a
谁能帮我处理一些相当复杂的 Django 查询? 这些是我的模型: class County(models.Model): name = models.CharField(max_length
我想从某个表中选择一行并根据另一个表对结果进行排序。 这是我的表: lang1_words: word_id - word statuses: word_id - status 在每个表中 word_
我是单元测试的新手,所以请对我宽容一些。我有一些查询 RESTful API 的模块。我发现在每个测试套件中,我都使用几行代码来启动一个简单的 ExpressJS Web 服务器,以模拟一些我可以从测
假设我有以下代码: var blinker = function(element){ if(stopped){ return; } else { var sampleMappi
我正在用 JavaScript 制作一个选择你自己的冒险风格的游戏,在本节中: evade = prompt("Go out of your way to avoid them, just in ca
我的代码: import java.awt.*; import java.awt.event.*; import javax.swing.*; public class Events1 extends
我正在使用 scipy ode 来解决钟摆问题。 from scipy import * import matplotlib.pyplot as plt from scipy.integrate im
我有一个 Google 表格,用于收集客户的注册数据。收集的数据包括学生的姓名、学生选择参加的类(class)以及信用卡号。提交后,我会收到通知。收到通知后,我会转到我的 Google 表格并从信用卡
我需要定义一个操作的两个版本,定义略有不同。它是一系列包含Nat指数的成分。 open import Data.Nat data Hom : ℕ → ℕ → Set where id : (
我正在研究游戏引擎 http://ducttape-dev.org使用 boost 作为依赖项之一。有一天,当我正在编写一个链接到我的游戏引擎的测试应用程序时,OgreProcedural 的 Ext
我正在 Android 中制作一个表达式计算器,所以我想在实际计算答案之前检查字符串是否符合有效表达式的条件。 我在 Java 中试过这个正则表达式: ^\s*([-+]?)(\d+)(?:\s*([
我有以下 postgresql 查询(为便于阅读而简化): select * from a_view where a in (select * from a_function(a_input))
我开始更好地掌握 PostgreSQL 索引,但我遇到了 OR 条件的问题,我不知道如何优化我的索引以加快查询速度。 我有 6 个条件,当单独运行时,它们的成本似乎很小。下面是修剪查询的示例,包括查询
有谁知道为什么下面的代码接受诸如123-123-1234这样的答案: [1-9]\\d{2}-[1-9]\\d{2}-\\d{4} 我想到了代码,它只接受先接受 2 个数字,再接受 2 个数字,然后再
在使用 Java 1.8u40 打开带有提示类型和附加的 StringConverter 的组合框时,我遇到了以下错误。这可以追溯到执行 FXML 的团队留下的示例字符串,与 Controller 中
在 MySQL 中,我有三个不同的数据库 - 我们将它们称为 A、B 和 C。 是否可以执行涉及所有三个数据库(A、B、C)中的表的事务? (所有数据库都在同一服务器上) 最佳答案 是的,你可以。这是
我是一名优秀的程序员,十分优秀!