r - 如何根据 r 中的有序向量替换列中的所有值-6ren

r - 如何根据 r 中的有序向量替换列中的所有值

转载作者：行者123 更新时间：2023-12-04 09:30:33

25

4

我正在尝试用有序类别替换数据框列中的所有数值。这是一个虚拟数据框:

df <- data.frame(a = c(1:100), b = sample(c(0,20), size = 100, replace = TRUE), c = c(1:100))

请注意，实际的数据框是使用 haven::read_dta() 导入的 dta 文件。实际数据框可以在 GSS here 上找到.我正在处理 2018 年的文件，并想用一组类别替换 b 中的所有值，即 0 到 20，如下所示:

educ_vec <- c("No formal schooling", "1st grade", "2nd grade", "3rd grade", "4th grade", "5th grade", "6th grade", "7th grade", "8th grade", "9th grade", "10th grade", "11th grade", "12th grade", "1 year of college", "2 years of college", "3 years of college", "4 years of college", "5 years of college", "6 years of college", "7 years of college", "8 years of college")
educ_fac <- factor(educ_vec, ordered = TRUE, levels = educ_vec)

如果我对每个类别都使用 mutate 和 ifelse，这个过程太长了，而且它不会保留 educ_fac 中的顺序.我尝试了几种方法一步到位，但没有成功。一种方法是这样的:

gss_df %>% 
  mutate(educ = fct_recode(educ, 
                           "No formal schooling" = 0, 
                           "1st grade" = 1, 
                           "2nd grade" = 2, 
                           "3rd grade" = 3, 
                           "4th grade" = 4, 
                           "5th grade" = 5, 
                           "6th grade" = 6, 
                           "7th grade" = 7, 
                           "8th grade" = 8, 
                           "9th grade" = 9, 
                           "10th grade" = 10, 
                           "11th grade" = 11, 
                           "12th grade" = 12, 
                           "1 year of college" = 13, 
                           "2 years of college" = 14, 
                           "3 years of college" = 15, 
                           "4 years of college" = 16, 
                           "5 years of college" = 17, 
                           "6 years of college" = 18, 
                           "7 years of college" = 19, 
                           "8 years of college" = 20))

Error: `f` must be a factor (or character vector or numeric vector).

其他两种方式类似，但均未成功:

gss_df %>% 
  mutate(educ = fct_recode(educ, educ_fac))

Error: `f` must be a factor (or character vector or numeric vector).

gss_df %>% 
  mutate(educ = recode_factor(educ, educ_vec, ordered = TRUE))

Error in UseMethod("recode") : no applicable method for 'recode' applied to an object of class "haven_labelled"

谁能解决这个问题？

最佳答案

由于某些原因无法读入dta文件，下面我模拟数据给大家展示一下我的建议。您从 educ_vec 向量开始。

educ_vec <- c("No formal schooling", "1st grade", 
"2nd grade", "3rd grade", "4th grade", "5th grade", 
"6th grade", "7th grade", "8th grade", "9th grade", 
"10th grade", "11th grade", "12th grade", "1 year of college", 
"2 years of college", "3 years of college", "4 years of college", 
"5 years of college", "6 years of college", "7 years of college", 
"8 years of college")

如果你查看 educ_vec ，它已经是你想要的格式了

# this is meant for 0
educ_vec[1]
[1] "No formal schooling"
# this is meant for 20
educ_vec[21]
[1] "8 years of college"

如果你的分数是 i，新的分类值将是 educ_vec[i+1]；所以我们可以在下面使用它:

set.seed(100)
gss_df <- data.frame(educ=sample(0:20,30,replace=TRUE))
gss_df %>% 
mutate(new=factor(educ_vec[educ+1],ordered = TRUE, levels = educ_vec))

   educ                new
1     9          9th grade
2     5          5th grade
3    15 3 years of college
4    18 6 years of college
5    13  1 year of college
6    11         11th grade
7     5          5th grade
8     3          3rd grade
9     5          5th grade
10    1          1st grade
11    6          6th grade
12    6          6th grade
13   10         10th grade
14   17 5 years of college
15   11         11th grade
16    2          2nd grade
17   18 6 years of college
18    7          7th grade
19   17 5 years of college
20    1          1st grade
21   18 6 years of college
22    3          3rd grade
23    3          3rd grade
24   19 7 years of college
25   15 3 years of college
26   20 8 years of college
27    6          6th grade
28   15 3 years of college
29   10         10th grade
30   19 7 years of college

是的，如果在数据中找不到某些因素，它会起作用:

gss_df <- data.frame(educ=0:5)%>%
mutate(new=factor(educ_vec[educ+1],ordered = TRUE, levels = educ_vec))

  educ                 new
1    0 No formal schooling
2    1           1st grade
3    2           2nd grade
4    3           3rd grade
5    4           4th grade
6    5           5th grade

您可以看到新列是预期类别的一个因素。

str(gss_df)
'data.frame':   6 obs. of  2 variables:
 $ educ: int  0 1 2 3 4 5
 $ new : Ord.factor w/ 21 levels "No formal schooling"<..: 1 2 3 4 5 6

如果您的分数不在 0-20 范围内，例如 -1、-2 或 21,22 等，那么我建议您执行以下操作:

names(educ_vec) = 0:20
gss_df <- data.frame(educ=c(-1,0,20,21))
# you can also use mutate
gss_df$new <- educ_vec[match(gss_df$educ,names(educ_vec))]
gss_df

  educ                 new
1   -1                <NA>
2    0 No formal schooling
3   20  8 years of college
4   21                <NA>

如果在你的 educ_vec 中找不到对应的名字，Match 将返回一个 NA

关于r - 如何根据 r 中的有序向量替换列中的所有值，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/59079478/

25

4

0

文章推荐： java-8 - Java8 Stream - 在单行中使用过滤器收集 foreach

文章推荐： meteor - react-bootstrap:关于未知 Prop 的警告

文章推荐： user-interface - 如何在 React Native 中处理不同的屏幕尺寸？

php - 如何用 "a"替换 "d"，用 "b"替换 "e"，用 "c"替换 "f"，。 . . "x"和 "a"， "y"和 "b"， "z"和 "c"？
我想对一个字符串执行搜索和替换，比如 password。正如您从问题中了解到的那样，替换后的字符串应变为 sdvvzrug。但不幸的是，下面的代码输出bbbbcaab: $search = ran
Python future 化而不用 old_div 替换/替换
我正在使用 futurize --stage2它应用了许多源代码转换以使代码 python2 和 python3 兼容。其中一个修复是所有分区 a/b 都替换为 old_div(a/b)，我想避免这种
read.csv 用 `?` 替换 `.` 等列名字符，用 `-` 替换 `...`
我正在使用 RStudio，但我在控制台上的输出被截断了。我找不到如何停止截断(我尝试搜索 ?options 以及在谷歌上搜索的时间比我想承认的要长)。编辑:我向大家道歉!我最初的长名称为“This
android - 替换、添加、替换 fragment ，然后导航后退按钮不适用于第一个 fragment
我有一个 fragment 堆栈，我在其中使用替换和相加。添加或替换我的 fragment 的代码(在我的 Activity 中)如下 private fun addFragment(fragment
javascript - 在 javascript 变量上一次性用 %20 替换/替换 ""和 ""？
我在一个数组中插入了一些字符串，但在我这样做之前，我想按照主题所说的去做。只用 %20 替换空格，我这样做: Name.push(linkText.replace(" ", "%20")); 但是我如
Java - StringBuilder 替换()显示错误 : method String. 替换(char，char)不适用
我正在尝试编译和测试我在网上看到的代码 Expanding an IP add 。但是，当我尝试编译它时，我收到有关 StringBuilder 替换方法的错误。它说: IPadd.java:52:
用 dplyr 中的 data_frame() 替换 data.frame 并用 bind_cols() 替换 cbind
我正在尝试使用 dplyr 的最新功能重写我的部分代码，方法是将 data.frame() 替换为 data_frame() 和 cbind() 与 bind_cols(): library(rgeo
替换()与 "[<-"？
我最近偶然发现了 replace()和 "[ x.tst s.tst s.tst [,1] [,2] [,3] [1,] 0 0 0
Vim 替换
我一直想知道，如何在给定的参数内进行替换。如果你有这样的一行: 123,Hello,World,(I am, here), unknown 你想更换 World与 Foobar那么这是一个简单的任务
java:替换 "with\"
如何转义字符串中的双引号？例如， input: "Nobody" output: \"Nobody\" 我尝试过这样的操作，但不起作用: String name = "Nobody"; name.r
JavaScript 替换
我正在做类似的事情: SQL sql sQl SqL var ps = document.getElementsByTagName('p'); for(var i = 0; i 但它不会替换文本。
javascript - 替换 "with\"
我正在尝试用 \" 替换所有 " 并用 JSON 解析字符串，但浏览器抛出错误 SyntaxError: JSON Parse error: Unrecognized token '\'. 下面是代码
Javascript 替换
大家好，在这里挣扎...... 是否可以将第一个正斜杠之间的任何内容替换为“”，但保留其余部分？例如var 将是 string "/anything-here-this-needs-to-be-re
JavaScript 替换
在下面的代码中，JavaScript 替换函数中的 alert(a) 将提醒匹配的字符串，在本例中，将是 {name} 和 {place}。这按照文档 javascript docs 的描述工作，即
MySQL 替换
+-----------------------------+ | tables | +-------------------
Java 替换 "with\"
我正在尝试用\"替换包含 "的字符串，下面是我尝试过的程序 String s="\"/test /string\""; s = s.replaceAll("\"", "\\\"");
JavaScript 替换？
var text = "a's ..a's ...\"... "; text = convert(text); function convert( text ) { var n = text
JavaScript 替换()
我正在尝试使用 JavaScript 中的替换函数，但有一个问题。 strNewDdlVolCannRegion = strNewDdlVolCannRegion.replace(/_existing
Javascript 替换
好吧，首先我对我的上一篇文章感到非常抱歉，但我真的需要帮助，我会把我真正想要的东西放在一个更清晰的代码中。我不擅长 javascript，所以希望你能帮助我。
Python拆分、替换
我正在写一张纸条，遇到了障碍。可能有更有效的方法来执行此操作，但我对 Python 还很陌生。我正在尝试创建用户生成的 IP 地址列表。我正在使用 print 来查看生成的值是否正确。当我运行此代码时

首页

博学

6Ren·AI

商城

r - 如何根据 r 中的有序向量替换列中的所有值