- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我一直在研究 R purrr 包,但遇到了障碍。我在下面创建了一些模拟数据,它们代表了我的数据实际外观的一小部分。
library(tidyverse)
my_data <- tribble(
~lookup_lists, ~old_vectors,
# Observation 1
list(
"X1" = "one",
"X7" = "two",
"X16" = "three"
),
c("Col1", "Col2", "Col3", "X1", "X7", "X16"),
# Observation 2
list(
"X3" = "one",
"X8" = "two",
"X22" = "three"
),
c("Col1", "Col2", "Col3", "X3", "X8", "X22")
)
此时,我想创建一个新列,该列具有与 old_vectors
相同的向量值,但重新编码以 X 开头的值以反射(reflect)名为lookup_lists
中的列表。例如,我希望第一行来自:
c("Col1", "Col2", "Col3", "X1", "X7", "X16")
到
c("Col1", "Col2", "Col3", "one", "two", "three")
并保存到嵌套小标题中的新列。这是我使用 map2
函数的尝试:
# Add a third column that has the recoded vectors
my_data <- my_data %>%
mutate(new_vectors = map2(.x = old_vectors, .y = lookup_lists, .f = ~recode(.x, .y)))
#> Error in mutate_impl(.data, dots): Evaluation error: Argument 2 must be named, not unnamed.
我不明白这一点,因为第二个参数 IS 已命名。这是第一个观察结果的 lookup_list 来展示我的观点:
my_data$lookup_lists[[1]]
$X1
[1] "one"
$X7
[1] "two"
$X16
[1] "three"
我想我遗漏了一些非常明显的东西,可能与 this 有关.任何帮助将不胜感激!
最佳答案
由于 'lookup_lists' 是一个命名的 list
,我们可以将它unlist
到一个命名的 vector
中,用它来匹配中的元素'old_vectors' 并替换具有与“键”与“old_vector”中的元素相匹配的值。不匹配的将是 NA
。使用 na.omit
删除它并与“old_vectors”中的“Col”元素(使用 grep
)连接
out <- my_data %>%
mutate(new_vectors = map2(old_vectors, lookup_lists,
~ c(grep('Col', .x, value = TRUE), unname(na.omit(unlist(.y)[.x])))))
out$new_vectors
#[[1]]
#[1] "Col1" "Col2" "Col3" "one" "two" "three"
#[[2]]
#[1] "Col1" "Col2" "Col3" "one" "two" "three"
关于r - 在 purrr::map2 中使用 dplyr::recode 时出现命名列表问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53658142/
如果我在管道中使用重新编码,则会收到错误: df % recode(unit, .missing="g") Error in UseMethod("recode") : no applicable
我想将一个命名向量或两个向量传递给 dplyr::recode。假设我有: library(dplyr) set.seed(1) x 或者使用do.call和recode do.call(dplyr
在分析数据时我们经常会遇到将变量值转换成其他的值的情况(如:将连续变量转成分类变量)这时就需要我们对原有数据进行重新编码。本文将介绍R软件中常用的三种重编吗方法: 1、使用逻辑判断式编码。 2、
表 1$subject 包含变量“生物学”、“化学”和“物理学”。 对于表 2,我想重新编码,将所有生物/化学实例替换为 1,将物理的所有实例替换为 0。 我尝试了以下代码,因为我相信使用 recod
我经常在 library(car) 中使用“重新编码”函数来重新编码变量中的级别。直到今天,我的代码都运行良好,但现在却出现了错误。 df 等没有任何变化,不确定发生了什么。 可能有人可以启发我! 我
重新编码是调查数据的常见做法,但最明显的路线需要花费更多的时间。 使用提供的样本数据完成相同任务的最快代码 system.time()在我的机器上获胜。 ## Sample data dat sys
我有两个列表(来自多波调查),如下所示: X1 X2 1 NA NA 2 NA NA 如何轻松地将其合并到第三项中,其中第三列始终采用 X1 或 X2 列的非 NA 值,并在两个值均为 NA 时
我正在尝试使用 dplyr::recode() 重新编码字符变量和 stringr::str_detect() .我意识到这可以通过 dplyr::case_when() 来完成,如此处所述:http
我想为数据集中由 core.vars 定义的以下变量重新编码以下值 4 = 1,并仍将其余变量保留在数据框中。 temp.df % mutate_if (is.integer, as.numeric
我一直在研究 R purrr 包,但遇到了障碍。我在下面创建了一些模拟数据,它们代表了我的数据实际外观的一小部分。 library(tidyverse) my_data % mutate(new_
我有 8GB 的 csv 文件和 8GB 的内存。每个文件每行有两个字符串,格式如下: a,c c,a f,g a,c c,a b,f c,a 对于较小的文件,我删除了重复项,计算前两列中每行
我正在使用 dplyr 重新编码。将值重新编码为 NA 时出现错误,但不是 NaN。这是一个例子: df % mutate(var=recode(var,`2`=0,`3`=NaN)) 工作正常,而
我有18列的数据框。列2到13包括数值,如0、1、2、4...我想根据范围将它们重新编码为三类:。我的尝试奏效了,但效率不高:。我很感谢你的帮助。
我有18列的数据框。列2到13包括数值,如0、1、2、4...我想根据范围将它们重新编码为三类:。我的尝试奏效了,但效率不高:。我很感谢你的帮助。
一段时间以来,我一直在尝试解决相当普遍的问题,主要包括三个步骤: 获取具有指定 URL 的 html 页面并将其内容存储在一个字符串中 从 html 元信息或 HTTP header 中检测内容编码
我是一名优秀的程序员,十分优秀!