r - 通过引用合并总和与 data.table-6ren

r - 通过引用合并总和与 data.table

转载作者：行者123 更新时间：2023-12-04 15:13:18

24

4

假设我有两个 data.table，dt_a 和 dt_b 定义如下。

library(data.table)
set.seed(20201111L)

dt_a <- data.table(
  foo = c("a", "b", "c")
)

dt_b <- data.table(
  bar = sample(c("a", "b", "c"), 10L, replace=TRUE),
  value = runif(10L)
)

dt_b[]
##      bar     value
##   1:   c 0.4904536
##   2:   c 0.9067509
##   3:   b 0.1831664
##   4:   c 0.0203943
##   5:   c 0.8707686
##   6:   a 0.4224133
##   7:   a 0.6025349
##   8:   b 0.4916672
##   9:   a 0.4566726
##  10:   b 0.8841110

我想通过引用在 dt_a 上加入 dt_b，对多重匹配求和。这样做的一种方法是首先创建 dt_b 的摘要(从而解决多重匹配问题)，然后合并。

dt_b_summary <- dt_b[, .(value=sum(value)), bar]
dt_a[dt_b_summary, value_good:=value, on=c(foo="bar")]
dt_a[]
##     foo value_good
##  1:   a   1.481621
##  2:   b   1.558945
##  3:   c   2.288367

但是，这将允许内存到对象dt_b_summary，这是低效的。

我想通过直接加入 dt_b 并对多个匹配求和来获得相同的结果。我正在寻找类似下面的内容，但这行不通。

dt_a[dt_b, value_bad:=sum(value), on=c(foo="bar")]
dt_a[]
##     foo value_good value_bad
##  1:   a   1.481621  5.328933
##  2:   b   1.558945  5.328933
##  3:   c   2.288367  5.328933

有人知道是否有可能吗？

最佳答案

我们可以使用 .EACHI 和 by

library(data.table)
dt_b[dt_a, .(value = sum(value)), on = .(bar = foo), by = .EACHI]
#   bar    value
#1:   a 1.481621
#2:   b 1.558945
#3:   c 2.288367

如果我们想更新原始对象'dt_a'

dt_a[, value := dt_b[.SD,  sum(value), on = .(bar = foo), by = .EACHI]$V1]
dt_a
#   foo    value
#1:   a 1.481621
#2:   b 1.558945
#3:   c 2.288367

对于多列

dt_b$value1 <- dt_b$value
nm1 <- c('value', 'value1')
dt_a[, (nm1) := dt_b[.SD, lapply(.SD, sum), 
       on = .(bar = foo), by = .EACHI][, .SD, .SDcols = nm1]]

关于r - 通过引用合并总和与 data.table，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/64794673/

24

4

0

文章推荐： ansible 用户配置中的当前用户

文章推荐： parsing - 双递归函数中的 Haskell 类型错误

文章推荐： c# - 检查用户是否具有角色 Discord.net

c++ - 将函数作为参数传递的良好做法 : copy, 引用，const 引用？
这个问题在这里已经有了答案: 关闭 10 年前。 Possible Duplicate: template pass by value or const reference or…? 以下对于将函数
C++ 重载运算符两次，一次返回非 const 引用，另一次返回 const 引用，偏好是什么？
我用相同的参数列表重载了一个运算符两次。但返回类型不同: T& operator()(par_list){blablabla} const T& operator()(par_list){bla
java - 如果 ViewModel 持有此 Activity 实现的接口(interface)引用，GC 是否会收集 Activity 引用？
假设我有实现接口(interface) I 的 Activity A。我的 ViewModel 类 (VM) 持有对实现接口(interface) I 的对象的引用: class A extends
PHP 引用 `$this`
PHP 如何解释 &$this ？为什么允许？我遇到了以下问题，这看起来像是 PHP 7.1 和 7.2 中的错误。它与 &$this 引用和跨命名空间调用以及 call_user_func_arr
引用 Php
谁能解释一下下面“&”的作用: class TEST { } $abc =& new TEST(); 我知道这是引用。但是有人可以说明我为什么以及什么时候需要这样的东西吗？或者给我指向一个对此有很好解
详解C++ 引用
引用变量是一个别名，也就是说，它是某个已存在变量的另一个名字。一旦把引用初始化为某个变量，就可以使用该引用名称或变量名称来指向变量。 C++ 引用 vs 指针引用很容易与指针混淆，它们之间有三
解析C++引用
目录引言背景结论引言我选择写C++中的引用是因为我感觉大多数人误解了引用。而我之所以有这个感受是因为我主持过很多C++的面试，并且我很少
16、Perl 引用
Perl 中的引用是指一个标量类型可以指向变量、数组、哈希表（也叫关联数组）甚至函数，可以应用在程序的任何地方创建引用定义变量的时候，在变量名前面加个 \，就得到了这个变量的一个引用 $sc
Perl，通过调用其父程序覆盖子程序 |引用
我编写了一个将从主脚本加载的 Perl 模块。该模块使用在主脚本中定义的子程序(我不是维护者)。对于主脚本中的一个子例程，需要扩展，但我不想修补主脚本。相反，我想覆盖我的模块中的函数并保存对原始子例
F# 引用 - 遍历由值表示的函数调用
我花了几个小时试图掌握 F# Quotations，但我遇到了一些障碍。我的要求是从可区分的联合类型中取出简单的函数(只是整数、+、-、/、*)并生成一个表达式树，最终将用于生成 C 代码。我知道使用
regex - 引用 - 密码验证
很多时候，问题(尤其是那些标记为 regex 的问题)询问验证密码的方法。似乎用户通常会寻求密码验证方法，包括确保密码包含特定字符、匹配特定模式和/或遵守最少字符数。这篇文章旨在帮助用户找到合适的密码
excel - 引用公式中的单元格地址/引用
我想通过 MIN 函数内的地址(例如，C800)引用包含文本的最后一个单元格。你能帮忙吗？ Sub Set_Formula() ' ----------------------------- Dim
for-of 循环中的 Javascript 引用
使用常规的 for 循环，我可以做类似的事情: for (let i = 0; i < objects.length; i++) { delete objects[i]; } 常规的 for-
cucumber :引用/不引用参数的最佳实践是什么
在 Cucumber 中，您定义了定义 BDD 语法的步骤；例如，您的测试可能有: When I navigate to step 3 然后你可以定义一个步骤: When /^I navigate t
linq - 表达式类型.引用
这是什么UnaryExpression的目的，以及应该怎样使用？最佳答案它需要一个 Expression对象并用另一个 Expression 包裹它.例如，如果您有一个用于 lambda 的表达式
JQuery 多个选择器，$(this) 引用？
给出以下内容 $("#identifier div:first, #idetifier2").fadeOut(300,function() { // I need to reference jus
xslt - XPath 引用
我不知道我要找的东西的正确术语，但我要找的是一个完整的引用，可以放在双引号之间的语句，比如 *， node()、@* 以及所有列出的 here加上任何其他存在的。我链接到的答案提供了一些细节，但还
regex - 引用-此正则表达式是什么意思？
This question's answers are a community effort。编辑现有答案以改善此职位。它当前不接受新的答案或互动。这是什么？这是常见问答的集合。这也是一个社区Wi
accessibility - Microsoft的UI自动化的教程/引用
Closed. This question does not meet Stack Overflow guidelines。它当前不接受答案。想改善这个问题吗？更新问题，以便将其作为on-topic
rust - 引用“静态生命周期不长？
考虑下一个代码: fn get_ref(slice: &'a Vec, f: fn(&'a Vec) -> R) -> R where R: 'a, { f(slice) } fn m

首页

博学

6Ren·AI

商城

r - 通过引用合并总和与 data.table