gpt4 book ai didi

r - 如何将 lapply 与 mutate 函数一起使用

转载 作者:行者123 更新时间:2023-12-05 05:10:08 25 4
gpt4 key购买 nike

如何将 lapply 与 mutate 函数一起使用

你好,我正在尝试将 lapply 与 mutate 函数结合使用。我正在处理嵌套列表数据。

让我们举个例子。 given 是包含两个元素的嵌套列表。每个元素都是10*2的列表。

given<-replicate(2,list(matrix(unlist(replicate(10,sample(c(0.2,0.3,0.4,0.1),2,replace=FALSE),simplify=FALSE)),ncol=2)))
colnames(given[[1]])<-c('a','b')
colnames(given[[2]])<-c('a','b')
given

我会将 0.1 和 0.2 转换为“低”,0.3 转换为“中”,0.4 转换为“高”。我使用了 lapply、mutate 和 if_else 函数。

new_given<-lapply(seq_along(given), function(x){
mutate(x,
given[[x]][['new']] = if_else(given[[x]][['a']] %in% c(0.1,0.2),'low',
if_else(given[[x]][['I12']] %in% c(0.3),'middle','high')))})

然而,错误发生了。它说有一个'意外')''。但是,括号的数量是正确配对的。

> new_given<-lapply(seq_along(given), function(x){
+ mutate(x,
+ given[[x]][['new']] = if_else(given[[x]][['a']] %in% c(0.1,0.2),'low',
Error: unexpected '=' in:
" mutate(x,
given[[x]][['new']] ="
> if_else(given[[x]][['I12']] %in% c(0.3),'middle','high')))})
Error: unexpected ')' in " if_else(given[[x]][['I12']] %in% c(0.3),'middle','high'))"
>

你能告诉我问题是什么以及如何解决吗?

*附加信息:我读了这篇文章,Using lapply with mutate in R但是,它使用了 data.frame,而不是处理列表数据。所以这些方法似乎有所不同。

最佳答案

您的方法存在很多问题。首先,您得到的错误只是在第一个错误(意外的“=”)发生后复制该行的其余部分的副作用。

但是,那个 错误的原因是不同的。您正在对 x 应用 mutate。 x 是长度为 1 的数字向量。但是,mutate 仅适用于数据帧(甚至不是矩阵!)。不过,您可以先将矩阵转换为 data.frames(正如 Ronak 在另一个答案中所建议的那样)。

最后,您的矩阵是 double 矩阵。您的方法可能在大部分时间都有效,但不能保证总是有效,因为即使一个数字看起来像 0.3,它实际上也可能是 0.3000000000000000001,在这种情况下 %in% 0.3 将返回 FALSE。现在看起来不太可能,但相信我,这种方法迟早会伤害到您,而且您不会看到它的到来。我是凭经验说的。

让我们首先创建一个函数,它接受一个矩阵,并根据它的第一列决定它应该是“低”、“中”还是“高”。

cut 函数需要多次中断,并为每个数字分配一个表示给定间隔的因子水平:

cut(given[[1]][,1], c(-Inf, 0.2, 0.3, Inf))

结果:

 [1] (0.3, Inf] (-Inf,0.2] (-Inf,0.2] (0.3, Inf] (-Inf,0.2] (0.3, Inf]
[7] (-Inf,0.2] (-Inf,0.2] (0.3, Inf] (-Inf,0.2]
Levels: (-Inf,0.2] (0.2,0.3] (0.3, Inf]

我们可以直接给结果分配标签:

cut(given[[1]][,1], c(-Inf, 0.2, 0.3, Inf), labels=c("low", "mid", "high"))

我们可以把它做成一个函数:

mklevels <- function(mtx) {
cut(mtx[,1], c(-Inf, 0.2, 0.3, Inf), labels=c("low", "mid", "high"))
}

与其将矩阵转换为数据框并添加新列,不如创建一个每个矩阵一列的新数据框:

data.frame(sapply(given, mklevels))

这样做的好处是,如果矩阵很大并且用于其他计算目的,将它们更改为数据帧并不是一种有效的方法。

如果您真的非常想使用 %in%,请将数据转换为因数。这样您就可以检查因子水平并查看是否存在问题。例如:

x <- c(0.3, 0.2, 0.3 + 1e-11, 0.1)
x

看起来很无辜:

> x
[1] 0.3 0.2 0.3 0.1

但是,x[4] %in% .3 返回 FALSE。但将其转换为一个因素并查看级别:

factor(x)

[1] 0.3 0.2 0.30000000001 0.1
Levels: 0.1 0.2 0.3 0.30000000001

将数据转换为因子后,您就可以安全地采用 Ronak 的方法。但我绝不会尝试使用数值向量!

关于r - 如何将 lapply 与 mutate 函数一起使用,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57003106/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com