- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我现在正在自学 R。我正在尝试使用以下内容将整数变量转换为分类变量。
train[, c("Store", "DayOfWeek")] <- apply(train[,c("Store", "DayOfWeek")], 2, as.factor)
但它会将变量转换为字符。无法弄清楚为什么 - 除了可能的 R 强制。
'data.frame': 1017209 obs. of 2 variables:
$ Store : chr "1" "2" "3" "4" ...
$ DayOfWeek : chr "5" "5" "5" "5" ...
当我单独对变量执行此操作(而不是使用应用)时,它起作用了。谢谢
最佳答案
apply
是错误的工具。执行此操作的“应用”方法是使用 lapply
,因为数据框是列表,其中每一列都是列表的一个元素:
mtcars[,c('cyl','vs')] <- lapply(mtcars[,c('cyl','vs')],as.factor)
> str(mtcars)
'data.frame': 32 obs. of 11 variables:
$ mpg : num 21 21 22.8 21.4 18.7 18.1 14.3 24.4 22.8 19.2 ...
$ cyl : Factor w/ 3 levels "4","6","8": 2 2 1 2 3 2 3 1 1 2 ...
$ disp: num 160 160 108 258 360 ...
$ hp : num 110 110 93 110 175 105 245 62 95 123 ...
$ drat: num 3.9 3.9 3.85 3.08 3.15 2.76 3.21 3.69 3.92 3.92 ...
$ wt : num 2.62 2.88 2.32 3.21 3.44 ...
$ qsec: num 16.5 17 18.6 19.4 17 ...
$ vs : Factor w/ 2 levels "0","1": 1 1 2 2 1 2 1 2 2 2 ...
$ am : num 1 1 1 0 0 0 0 0 0 0 ...
$ gear: num 4 4 4 3 3 3 3 4 4 4 ...
$ carb: num 4 4 1 1 2 1 4 2 2 4 ...
一般来说,对数据框使用apply
要谨慎。 apply
文档的第一行清楚地表明它所做的第一件事是将它的参数强制转换为一个矩阵,而矩阵只能保存一种类型的数据。因此,您的数据框将立即转换为所有数字、所有整数、所有字符,具体取决于其中的内容。
关于r - as.factor 不将整数转换为因子,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34549757/
就目前而言,这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持,但这个问题可能会引起辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visit the he
就目前而言,这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持,但这个问题可能会引起辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visit the he
我想将引用保留为 Factor 中元组的成员。但是,当我尝试对其执行“调用”时,出现错误“无法将调用应用于运行时计算值”。请注意,将函数标记为“内联”不会执行任何操作。 示例代码: USING: ac
我最近看到 Matt Dowle 用 as.factor() 写了一些代码, 具体来说 for (col in names_factors) set(dt, j=col, value=as.facto
(所描述的行为是一个错误!) 我不明白 group_by 对作为因素的列和不是因素的列的影响。下面分析这两种可能性: library(dplyr) df % group_by(height) %>%
有没有人用 Factor 构建了一个 Web 应用程序? ?您在此过程中遇到了哪些绊脚石或问题? 最佳答案 试试 this . 关于factor-lang - 使用 Factor 构建 Web 应用程
例如,如果 CPU 有四个内核和八个内核线程。 我应该设置 核心池大小因子 一直设置到8? 的一般尺寸是多少?最大池大小因子 关于 核心池大小因子 ? 我提到的其他设置是否与 Akka 配置相关? 最
我正在尝试通过重新创建给我的数据结果来在 R 中实现 NB 分类器。现在我只是对训练数据本身进行测试,看看准确性如何。 数据集中有 29 个变量,其中一个称为“状态”。它有两个值:Win 和 Lose
当一个可被另一个整除时,数字的位之间是否存在任何关系? 36位与9位或4位或12位、10位(1010)与5位(101)、21位(10101)与7位(00111)的位序列有什么关系? 谢谢。如果有些句子
我学会了一种叫做“线性筛”的算法https://cp-algorithms.com/algebra/prime-sieve-linear.html能够在线性时间内得到所有小于 N 的素数。 这个算法有
我正在使用 R 中的一个数据集,它带有一个代码本,它基本上告诉我因子变量的不同级别的标签应该是什么。例如,使用密码本,我可以看到在我的“性别”变量中,0 是“女性”,1 是“男性”。我正在使用此信息相
我试图将数据集分成具有因子变量和非因子变量的部分。 我正在做类似的事情: 这部分工作: factorCols <- sapply(df1, is.factor) factorDf <- df1[,fa
我有以下设置。 df <- data.frame(aa = rnorm(1000), bb = rnorm(1000)) apply(df, 2, typeof) # aa bb
我现在正在自学 R。我正在尝试使用以下内容将整数变量转换为分类变量。 train[, c("Store", "DayOfWeek")] str(mtcars) 'data.frame': 32
我正在玩 Factor,试图对串联编程有一点了解。写一个词来平方一个数字是微不足道的: : square ( n -- n ) dup * ; 但对于我来说,我似乎无法弄清楚如何计算一个数字的立方:
给定一个数 x,我如何找到两个数 y 和 z,这样 x = y * z 和 y==Z 或者 y 和 z 彼此接近?此外,x、y、z 都是整数。 示例: x = 16484, y=z=128; x=
我有以下设置。 df <- data.frame(aa = rnorm(1000), bb = rnorm(1000)) apply(df, 2, typeof) # aa bb
关闭。这个问题需要多问focused 。目前不接受答案。 想要改进此问题吗?更新问题,使其仅关注一个问题 editing this post . 已关闭 3 年前。 Improve this ques
如果你觉得这听起来很傻,我提前道歉,我是 splunk 的新手,并且学过 udemy 类(class),但无法弄清楚这一点。 If I check my indexes.conf file in cl
为什么此代码:as.factor(c("\U201C", '"3', "1", "2", "\U00B5")),在每个操作系统上返回因子级别的不同顺序? 在Linux上: > as.factor(c(
我是一名优秀的程序员,十分优秀!