- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在查看data.table
的文档,并且从这里的一些对话中也注意到rbindlist
应该比rbind更好
.
我想知道为什么 rbindlist
比 rbind
更好,以及在哪些场景 rbindlist
真正优于 rbind
>?
在内存利用率方面有什么优势吗?
最佳答案
rbindlist
是 do.call(rbind, list(...))
的优化版本,众所周知,使用 rbind.data.frame
时速度很慢
一些问题显示rbindlist
在哪里闪耀的是
Fast vectorized merge of list of data.frames by row
这些具有显示其速度的基准。
<小时/> rbind.data.frame
进行大量检查,并将按名称进行匹配。 (即 rbind.data.frame 将考虑列可能具有不同顺序并按名称匹配的事实),rbindlist
不做这种检查,并且会按位置加入
例如
do.call(rbind, list(data.frame(a = 1:2, b = 2:3), data.frame(b = 1:2, a = 2:3)))
## a b
## 1 1 2
## 2 2 3
## 3 2 1
## 4 3 2
rbindlist(list(data.frame(a = 1:5, b = 2:6), data.frame(b = 1:5, a = 2:6)))
## a b
## 1: 1 2
## 2: 2 3
## 3: 1 2
## 4: 2 3
<小时/>
它曾经很难处理factors
,由于已修复的错误:
rbindlist two data.tables where one has factor and other has character type for a column (Bug #2650)
它存在重复列名的问题
看 Warning message: in rbindlist(allargs) : NAs introduced by coercion: possible bug in data.table? (Bug #2384)
<小时/> rbindlist
可以处理lists
data.frames
和data.tables
,并将返回一个没有行名的 data.table
你可以使用 do.call(rbind, list(...))
来获得困惑的行名。参见
How to avoid renaming of rows when using rbind inside do.call?
<小时/>内存方面rbindlist
在 C
中实现,内存效率也很高,它使用 setattr
通过引用设置属性
rbind.data.frame
在 R
中实现,它进行了大量的分配,并使用 attr<-
(以及 class<-
和 rownames<-
所有这些都将(内部)创建所创建的 data.frame 的副本。
关于r - 为什么rbindlist是 "better"而不是rbind?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15673550/
我循环遍历字符串列表以查看该字符串是否包含在字典的值中,然后尝试从该值中删除该字符串。 目前我是这样做的: Dictionary formValues = new Dictionary(); form
我正在将一些旧的 Java 4 代码更新到 Java 8(这里粘贴的太多了),最初的程序员选择让他们的几乎每个类都扩展这个只有静态方法和常量的巨大类,但我不知道他们的推理。 例如: public cl
在使用 z3 解决整数实数约束时,以下两种编写(等效)约束的方法中哪一种更可取(性能方面)? (断言(=>(和( (and (<= (/1.0 1024.0) value) (< value (/1.
我知道这是一个会引起很多争论的话题,但我想知道人们认为使用对象数据源的各种利弊是什么。我现在正在和另一个程序员做一个项目,他的经验和舒适度都 Root 于经典的 ASP,我不确定哪种方式会 a) 快速
抱歉,这是comp-sci 101的问题。我只是不确定是否缺少明显的东西。 因此,假设某些用户输入引发了错误,而我想捕获它并返回一些反馈。错误将是一个数字,0-8。0表示“无错误”。如果错误为3(假设
我们的 JSF Web 应用程序中有多个具有类似功能的搜索页面: 他们有搜索结果(将这些对象称为 T) 有一个包含搜索条件的对象(将此对象称为 C) 他们能够用名称保存搜索条件(将此对象称为 S) 所
我想创建一系列从基础对象继承或复制实例属性的对象。这使我决定使用哪种模式,我想询问您对哪种方法“更好”的看法。 //APPLY: // --------------------------------
我正在构建我的第一个 android 应用程序,也是我的第一个 Java 应用程序。我似乎无法理解枚举和数组列表之间的区别。我正在构建一个简单的闪存卡应用程序,它将包含带有问题的闪存卡,并将其存储为图
我有来自不同来源的客户和潜在客户,我需要弄清楚客户是否已经注册为潜在客户。 我使用 12 个字段进行匹配: address1_clear address2_clear address_clear co
Python 中最好的文字定界符是什么?为什么?单 ' 还是双 "?最重要的是,为什么? 我是 Python 的初学者,我正在努力坚持使用一个。我知道在 PHP 中,例如 "是首选,因为 PHP 不会
这个问题在这里已经有了答案: how to compare two optional NSArrays in Swift (4 个答案) 关闭 6 年前。 我正试图找到一种更好的方法来测试平等性。我
当您有一个表示为数组的循环缓冲区,并且您需要环绕索引(即,当您达到可能的最高索引并递增它时),是否“更好”: return (++i == buffer.length) ? 0: i; 或者 retu
有没有更好的(即更易读的)方式来写这个? if (isset($input_vars['directive']) && $input_vars['directive'] == 'edit') { 最佳
如果我必须在一个句子中找到 let's say a word,我可以想到两种方法 使用 string.IndexOf 使用正则表达式 哪个在性能或最佳实践方面更好 最佳答案 如果不用正则表达式做某事相
我通常知道两种用 C 语言设计通用链表数据结构的方法。我想知道哪种方法更好。在提问之前,我将简要介绍这两种方法: 一种方法是围绕如下结构构建函数: struct list_element {
我总是假设将 double 除以整数会导致更快的代码,因为编译器会选择更好的微码来计算: double a; double b = a/3.0; double c = a/3; // will com
有时,Border控制或 Rectangle控制将满足我的需求。一个例子是,当我正在实现 ControlTemplate 并且我已经在应用分层技术(即在网格中堆叠控件)时,我不需要将不同的 Radiu
代码 (Java) 片段 ..... ..... if ( response.check() == checkNumber ) { String message = "You ar
投资组合A→基金1 投资组合A→基金2 投资组合A→基金3 如果不使用is/has,我就无法框定我的句子。但是在1和2之间 1)具有: class PortfolioA { List obj;
我只是想知道哪个更好,或者更推荐用于处理表单数据。 // Controller // validation etc $data = array('name'=>$this->input->post('
我是一名优秀的程序员,十分优秀!