- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
从data.table
手册中:
In fact we like it so much that data.table contains a counting sort algorithm for character vectors using R’s internal global string cache. This is particularly fast for character vectors containing many duplicates, such as grouped data in a key column. This means that character is often preferred to factor. Factors are still fully supported, in particular ordered factors (where the levels are not in alphabetic order).
factor
不只是整数,它应该比
counting sort
更容易做
character
吗?
最佳答案
Isn't factor just integer which should be easier to do counting sort than character?
setkey
(和ad hoc
by
)想要克服的目标。尝试在随机排序的字符向量上计时
factor()
,例如1e6长,1e4级。然后将其与原始随机排序的字符向量上的
setkey
或即席
by
进行比较。
关于r - 为什么在data.table中使用 "character is often preferred to factor"作为 key ?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18304760/
就目前而言,这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持,但这个问题可能会引起辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visit the he
就目前而言,这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持,但这个问题可能会引起辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visit the he
我想将引用保留为 Factor 中元组的成员。但是,当我尝试对其执行“调用”时,出现错误“无法将调用应用于运行时计算值”。请注意,将函数标记为“内联”不会执行任何操作。 示例代码: USING: ac
我最近看到 Matt Dowle 用 as.factor() 写了一些代码, 具体来说 for (col in names_factors) set(dt, j=col, value=as.facto
(所描述的行为是一个错误!) 我不明白 group_by 对作为因素的列和不是因素的列的影响。下面分析这两种可能性: library(dplyr) df % group_by(height) %>%
有没有人用 Factor 构建了一个 Web 应用程序? ?您在此过程中遇到了哪些绊脚石或问题? 最佳答案 试试 this . 关于factor-lang - 使用 Factor 构建 Web 应用程
例如,如果 CPU 有四个内核和八个内核线程。 我应该设置 核心池大小因子 一直设置到8? 的一般尺寸是多少?最大池大小因子 关于 核心池大小因子 ? 我提到的其他设置是否与 Akka 配置相关? 最
我正在尝试通过重新创建给我的数据结果来在 R 中实现 NB 分类器。现在我只是对训练数据本身进行测试,看看准确性如何。 数据集中有 29 个变量,其中一个称为“状态”。它有两个值:Win 和 Lose
当一个可被另一个整除时,数字的位之间是否存在任何关系? 36位与9位或4位或12位、10位(1010)与5位(101)、21位(10101)与7位(00111)的位序列有什么关系? 谢谢。如果有些句子
我学会了一种叫做“线性筛”的算法https://cp-algorithms.com/algebra/prime-sieve-linear.html能够在线性时间内得到所有小于 N 的素数。 这个算法有
我正在使用 R 中的一个数据集,它带有一个代码本,它基本上告诉我因子变量的不同级别的标签应该是什么。例如,使用密码本,我可以看到在我的“性别”变量中,0 是“女性”,1 是“男性”。我正在使用此信息相
我试图将数据集分成具有因子变量和非因子变量的部分。 我正在做类似的事情: 这部分工作: factorCols <- sapply(df1, is.factor) factorDf <- df1[,fa
我有以下设置。 df <- data.frame(aa = rnorm(1000), bb = rnorm(1000)) apply(df, 2, typeof) # aa bb
我现在正在自学 R。我正在尝试使用以下内容将整数变量转换为分类变量。 train[, c("Store", "DayOfWeek")] str(mtcars) 'data.frame': 32
我正在玩 Factor,试图对串联编程有一点了解。写一个词来平方一个数字是微不足道的: : square ( n -- n ) dup * ; 但对于我来说,我似乎无法弄清楚如何计算一个数字的立方:
给定一个数 x,我如何找到两个数 y 和 z,这样 x = y * z 和 y==Z 或者 y 和 z 彼此接近?此外,x、y、z 都是整数。 示例: x = 16484, y=z=128; x=
我有以下设置。 df <- data.frame(aa = rnorm(1000), bb = rnorm(1000)) apply(df, 2, typeof) # aa bb
关闭。这个问题需要多问focused 。目前不接受答案。 想要改进此问题吗?更新问题,使其仅关注一个问题 editing this post . 已关闭 3 年前。 Improve this ques
如果你觉得这听起来很傻,我提前道歉,我是 splunk 的新手,并且学过 udemy 类(class),但无法弄清楚这一点。 If I check my indexes.conf file in cl
为什么此代码:as.factor(c("\U201C", '"3', "1", "2", "\U00B5")),在每个操作系统上返回因子级别的不同顺序? 在Linux上: > as.factor(c(
我是一名优秀的程序员,十分优秀!