gpt4 book ai didi

r - 从具有可变字段数的 CSV 导入前三个和后三个字段

转载 作者:行者123 更新时间:2023-12-01 22:20:44 25 4
gpt4 key购买 nike

我有一个 csv 格式的数据集。不幸的是,每一行都有不同数量的“,”逗号。我有兴趣从 R 文件中导入前 3 个和后 3 个变量。

例如:

>行:“A”,“B”,“C”,“D”,...,“X”,Y“,”Z“

我想实现以下`

>行:“A”,“B”,“C”,“X”,“Y”,“Z”

我尝试使用 grep,通过使用正则表达式来查找前 3 个变量:

new_data <- grep("([^,]+)(,[^,]+){2}", dataset, values=TRUE)

在该操作之后,它向我显示了存在该表达式的所有行。

如何使用 grep 删除行中的以下变量,如果可能的话,如何删除整个间隔(<3;n-3> 中的每个变量)。

你现在有其他方法来解决这个问题吗?

最佳答案

使用 applyheadtail 的组合:

d2 <- data.frame(t(apply(d1, 1, function(x) c(head(x[x != ''],3), tail(x[x != ''],3)))))

导致:

> d2
X1 X2 X3 X4 X5 X6
1 a b c x y z
2 a b c g h i
3 a b c t u v

使用@VarunM 的数据:

d1 <- read.csv(text='a, b, c, d, e, f, g, h, i, j, k, l, m, n, o, p, q, r, s, t, u, v, w, x, y, z
a, b, c, d, e, f, g, h, i
a, b, c, d, e, f, g, h, i, j, k, l, m, n, o, p, q, r, s, t, u, v', header = FALSE, fill = TRUE)

关于r - 从具有可变字段数的 CSV 导入前三个和后三个字段,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40282349/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com