gpt4 book ai didi

r - 拆分数据框中的列?

转载 作者:行者123 更新时间:2023-12-04 11:59:50 24 4
gpt4 key购买 nike

我有这个数据框,其中包含来自 IMDb 的数据。其中一列的电影名称和年份附在括号中。看起来像这样:

The Shawshank Redemption (1994)

我真正想要的是将标题和年份分开。我尝试了几种不同的方法(split、strsplit),但没有成功。我尝试在第一个括号上拆分,但是这两个拆分函数似乎不喜欢非字符参数。有人有什么想法吗?

最佳答案

strsplit 适用于 character 列。因此,如果该列是factor 类,我们需要将其转换为character 类(as.character(..))。在这里,我匹配零个或多个空格 (\\s*) 后跟括号 (\\() 或 | 右括号 (\\)) 到拆分

strsplit(as.character(d1$v1), '\\s*\\(|\\)')[[1]]
#[1] "The Shawshank Redemption" "1994"

或者我们可以将括号放在 [] 中,这样我们就不必转义 \\ (正如@Avinash Raj 所评论的)

strsplit(as.character(d1$v1), '\\s*[()]')[[1]]

数据

v1 <- 'The Shawshank Redemption (1994)'
d1 <- data.frame(v1)

关于r - 拆分数据框中的列?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32742674/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com