- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我想使用 apply()
将变量转换为因子:
a <- data.frame(x1 = rnorm(100),
x2 = sample(c("a","b"), 100, replace = T),
x3 = factor(c(rep("a",50) , rep("b",50))))
a2 <- apply(a, 2,as.factor)
apply(a2, 2,class)
x1 x2 x3
"character" "character" "character"
最佳答案
apply
将您的 data.frame 转换为字符矩阵。使用 lapply
:
lapply(a, class)
# $x1
# [1] "numeric"
# $x2
# [1] "factor"
# $x3
# [1] "factor"
lapply
:
a2 <- lapply(a, as.factor)
lapply(a2, class)
# $x1
# [1] "factor"
# $x2
# [1] "factor"
# $x3
# [1] "factor"
str
:
str(a)
# 'data.frame': 100 obs. of 3 variables:
# $ x1: num -1.79 -1.091 1.307 1.142 -0.972 ...
# $ x2: Factor w/ 2 levels "a","b": 2 1 1 1 2 1 1 1 1 2 ...
# $ x3: Factor w/ 2 levels "a","b": 1 1 1 1 1 1 1 1 1 1 ...
apply
do 是将参数转换为矩阵。所以
apply(a)
相当于
apply(as.matrix(a))
.如您所见
str(as.matrix(a))
给你:
chr [1:100, 1:3] " 0.075124364" "-1.608618269" "-1.487629526" ...
- attr(*, "dimnames")=List of 2
..$ : NULL
..$ : chr [1:3] "x1" "x2" "x3"
class
返回
"character"
对于所有列。
lapply
在列上工作,所以给你你想要的(它对每一列做类似
class(a$column_name)
的事情)。
apply
为什么
apply
和
as.factor
不起作用:
In all cases the result is coerced by as.vector to one of the basic vector types before the dimensions are set, so that (for example) factor results will be coerced to a character array.
sapply
和
as.factor
不起作用,您可以在帮助中查看
sapply
:
Value (...) An atomic vector or matrix or list of the same length as X (...) If simplification occurs, the output type is determined from the highest type of the return values in the hierarchy NULL < raw < logical < integer < real < complex < character < list < expression, after coercion of pairlists to lists.
data.frame
?
as.data.frame
正如你在评论中写道:
a2 <- as.data.frame(lapply(a, as.factor))
str(a2)
'data.frame': 100 obs. of 3 variables:
$ x1: Factor w/ 100 levels "-2.49629293159922",..: 60 6 7 63 45 93 56 98 40 61 ...
$ x2: Factor w/ 2 levels "a","b": 1 1 2 2 2 2 2 1 2 2 ...
$ x3: Factor w/ 2 levels "a","b": 1 1 1 1 1 1 1 1 1 1 ...
factor
替换选定的字符列有一个技巧:
a3 <- data.frame(x1=letters, x2=LETTERS, x3=LETTERS, stringsAsFactors=FALSE)
str(a3)
'data.frame': 26 obs. of 3 variables:
$ x1: chr "a" "b" "c" "d" ...
$ x2: chr "A" "B" "C" "D" ...
$ x3: chr "A" "B" "C" "D" ...
columns_to_change <- c("x1","x2")
a3[, columns_to_change] <- lapply(a3[, columns_to_change], as.factor)
str(a3)
'data.frame': 26 obs. of 3 variables:
$ x1: Factor w/ 26 levels "a","b","c","d",..: 1 2 3 4 5 6 7 8 9 10 ...
$ x2: Factor w/ 26 levels "A","B","C","D",..: 1 2 3 4 5 6 7 8 9 10 ...
$ x3: chr "A" "B" "C" "D" ...
a3 <- data.frame(x1=letters, x2=LETTERS, x3=LETTERS, stringsAsFactors=FALSE)
a3[, ] <- lapply(a3, as.factor)
str(a3)
'data.frame': 26 obs. of 3 variables:
$ x1: Factor w/ 26 levels "a","b","c","d",..: 1 2 3 4 5 6 7 8 9 10 ...
$ x2: Factor w/ 26 levels "A","B","C","D",..: 1 2 3 4 5 6 7 8 9 10 ...
$ x3: Factor w/ 26 levels "A","B","C","D",..: 1 2 3 4 5 6 7 8 9 10 ...
关于r - 为什么 as.factor 在 apply 内部使用时会返回一个字符?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2392216/
就目前而言,这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持,但这个问题可能会引起辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visit the he
就目前而言,这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持,但这个问题可能会引起辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visit the he
我想将引用保留为 Factor 中元组的成员。但是,当我尝试对其执行“调用”时,出现错误“无法将调用应用于运行时计算值”。请注意,将函数标记为“内联”不会执行任何操作。 示例代码: USING: ac
我最近看到 Matt Dowle 用 as.factor() 写了一些代码, 具体来说 for (col in names_factors) set(dt, j=col, value=as.facto
(所描述的行为是一个错误!) 我不明白 group_by 对作为因素的列和不是因素的列的影响。下面分析这两种可能性: library(dplyr) df % group_by(height) %>%
有没有人用 Factor 构建了一个 Web 应用程序? ?您在此过程中遇到了哪些绊脚石或问题? 最佳答案 试试 this . 关于factor-lang - 使用 Factor 构建 Web 应用程
例如,如果 CPU 有四个内核和八个内核线程。 我应该设置 核心池大小因子 一直设置到8? 的一般尺寸是多少?最大池大小因子 关于 核心池大小因子 ? 我提到的其他设置是否与 Akka 配置相关? 最
我正在尝试通过重新创建给我的数据结果来在 R 中实现 NB 分类器。现在我只是对训练数据本身进行测试,看看准确性如何。 数据集中有 29 个变量,其中一个称为“状态”。它有两个值:Win 和 Lose
当一个可被另一个整除时,数字的位之间是否存在任何关系? 36位与9位或4位或12位、10位(1010)与5位(101)、21位(10101)与7位(00111)的位序列有什么关系? 谢谢。如果有些句子
我学会了一种叫做“线性筛”的算法https://cp-algorithms.com/algebra/prime-sieve-linear.html能够在线性时间内得到所有小于 N 的素数。 这个算法有
我正在使用 R 中的一个数据集,它带有一个代码本,它基本上告诉我因子变量的不同级别的标签应该是什么。例如,使用密码本,我可以看到在我的“性别”变量中,0 是“女性”,1 是“男性”。我正在使用此信息相
我试图将数据集分成具有因子变量和非因子变量的部分。 我正在做类似的事情: 这部分工作: factorCols <- sapply(df1, is.factor) factorDf <- df1[,fa
我有以下设置。 df <- data.frame(aa = rnorm(1000), bb = rnorm(1000)) apply(df, 2, typeof) # aa bb
我现在正在自学 R。我正在尝试使用以下内容将整数变量转换为分类变量。 train[, c("Store", "DayOfWeek")] str(mtcars) 'data.frame': 32
我正在玩 Factor,试图对串联编程有一点了解。写一个词来平方一个数字是微不足道的: : square ( n -- n ) dup * ; 但对于我来说,我似乎无法弄清楚如何计算一个数字的立方:
给定一个数 x,我如何找到两个数 y 和 z,这样 x = y * z 和 y==Z 或者 y 和 z 彼此接近?此外,x、y、z 都是整数。 示例: x = 16484, y=z=128; x=
我有以下设置。 df <- data.frame(aa = rnorm(1000), bb = rnorm(1000)) apply(df, 2, typeof) # aa bb
关闭。这个问题需要多问focused 。目前不接受答案。 想要改进此问题吗?更新问题,使其仅关注一个问题 editing this post . 已关闭 3 年前。 Improve this ques
如果你觉得这听起来很傻,我提前道歉,我是 splunk 的新手,并且学过 udemy 类(class),但无法弄清楚这一点。 If I check my indexes.conf file in cl
为什么此代码:as.factor(c("\U201C", '"3', "1", "2", "\U00B5")),在每个操作系统上返回因子级别的不同顺序? 在Linux上: > as.factor(c(
我是一名优秀的程序员,十分优秀!