gpt4 book ai didi

r - 如何 dplyr 按列索引重命名列?

转载 作者:行者123 更新时间:2023-12-02 07:14:42 25 4
gpt4 key购买 nike

以下代码重命名数据集中的第一列:

require(dplyr)    
mtcars %>%
setNames(c("RenamedColumn", names(.)[2:length(names(.))]))

期望的结果:

                    RenamedColumn cyl  disp  hp drat    wt  qsec vs am gear carb
Mazda RX4 21.0 6 160.0 110 3.90 2.620 16.46 0 1 4 4
Mazda RX4 Wag 21.0 6 160.0 110 3.90 2.875 17.02 0 1 4 4
Datsun 710 22.8 4 108.0 93 3.85 2.320 18.61 1 1 4 1

使用重命名和列索引是否可以得到相同的结果?

这个:

mtcars %>%
rename(1 = "ChangedNameAgain")

将会失败:

Error in source("~/.active-rstudio-document", echo = TRUE) : 
~/.active-rstudio-document:7:14: unexpected '='
6: mtcars %>%
7: rename(1 =
^

类似地,尝试使用 rename_.[[1]] 作为列引用将返回错误。

最佳答案

dplyr 0.7.5rlang 0.2.1tidyselect开始> 0.2.4,这很简单:

library(dplyr)

rename(mtcars, ChangedNameAgain = 1)

# ChangedNameAgain cyl disp hp drat wt qsec vs am gear carb
# Mazda RX4 21.0 6 160.0 110 3.90 2.620 16.46 0 1 4 4
# Mazda RX4 Wag 21.0 6 160.0 110 3.90 2.875 17.02 0 1 4 4
# Datsun 710 22.8 4 108.0 93 3.85 2.320 18.61 1 1 4 1
# Hornet 4 Drive 21.4 6 258.0 110 3.08 3.215 19.44 1 0 3 1
# Hornet Sportabout 18.7 8 360.0 175 3.15 3.440 17.02 0 0 3 2
# ...
<小时/>

原始答案和编辑现已过时:

rename() 的逻辑是 new_name = old_name,因此 ChangedNameAgain = 11 = ChangedNameAgain 更有意义.

我建议:

mtcars %>% rename_(ChangedNameAgain = names(.)[1])
# ChangedNameAgain cyl disp hp drat wt qsec vs am gear carb
# Mazda RX4 21.0 6 160.0 110 3.90 2.620 16.46 0 1 4 4
# Mazda RX4 Wag 21.0 6 160.0 110 3.90 2.875 17.02 0 1 4 4
# Datsun 710 22.8 4 108.0 93 3.85 2.320 18.61 1 1 4 1
# Hornet 4 Drive 21.4 6 258.0 110 3.08 3.215 19.44 1 0 3 1
# Hornet Sportabout 18.7 8 360.0 175 3.15 3.440 17.02 0 0 3 2
# Valiant 18.1 6 225.0 105 2.76 3.460 20.22 1 0 3 1

编辑

dplyr 版本 0.6/0.7 起,我还没有完全了解基于 rlang 的新 dplyr 编程系统。

我最初的答案中使用的 rename 的下划线后缀版本现已弃用,并且根据 @jzadra 的评论,它无论如何也不适用于像 "foo bar"这样语法上有问题的名称.

这是我对新的基于 rlang 的非标准评估系统的尝试。请随时在评论中告诉我我做错了什么:

df <- tibble("foo" = 1:2, "bar baz" = letters[1:2])

# # A tibble: 2 x 2
# foo `bar baz`
# <int> <chr>
# 1 1 a
# 2 2 b

首先,我直接尝试使用rename(),但不幸的是我遇到了错误。好像是FIXME (或者这个 FIXME 不相关吗?)在源代码中(我使用的是 dplyr 0.7.4),所以它将来可以工作:

df %>% rename(qux = !! quo(names(.)[[2]]))

# Error: Expressions are currently not supported in `rename()`

(编辑:现在的错误消息(dplyr 0.7.5)显示UseMethod(“rename_”)中的错误:没有适用于“rename_”的方法应用于“function”类的对象)

(2018年6月14日更新:df %>% rename(qux = !! quo(names(.)[[2]])) 现在似乎可以工作,仍然使用 dplyr 0.7.5,不确定底层包是否更改)。

这是一个使用 select 的解决方法。但它不像 rename 那样保留列顺序:

df %>% select(qux = !! quo(names(.)[[2]]), everything())

# # A tibble: 2 x 2
# qux foo
# <chr> <int>
# 1 a 1
# 2 b 2

如果我们想将它放入一个函数中,我们必须使用 := 稍微修改它以允许在左侧取消引用。如果我们想要对字符串和裸变量名称等输入具有鲁棒性,我们必须使用 enquo()quo_name( ) (老实说我不完全理解它的作用):

rename_col_by_position <- function(df, position, new_name) {
new_name <- enquo(new_name)
new_name <- quo_name(new_name)
select(df, !! new_name := !! quo(names(df)[[position]]), everything())
}

这适用于字符串形式的新名称:

rename_col_by_position(df, 2, "qux")

# # A tibble: 2 x 2
# qux foo
# <chr> <int>
# 1 a 1
# 2 b 2

这适用于新名称作为限制:

rename_col_by_position(df, 2, quo(qux))

# # A tibble: 2 x 2
# qux foo
# <chr> <int>
# 1 a 1
# 2 b 2

这适用于新名称作为裸名称:

rename_col_by_position(df, 2, qux)

# # A tibble: 2 x 2
# qux foo
# <chr> <int>
# 1 a 1
# 2 b 2

甚至这也有效:

rename_col_by_position(df, 2, `qux quux`)

# # A tibble: 2 x 2
# `qux quux` foo
# <chr> <int>
# 1 a 1
# 2 b 2

关于r - 如何 dplyr 按列索引重命名列?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42769650/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com