gpt4 book ai didi

regex - 在 R 中使用未转义的分隔符拆分字符串

转载 作者:行者123 更新时间:2023-12-04 23:03:28 25 4
gpt4 key购买 nike

我必须用 R 读取一个文件,其中可变数量的列由 | 分隔。特点。但是,如果它前面有 \它不应被视为分隔符。

我首先想到的是 strsplit(x, "[^\\][|]")会起作用,但这里的问题是每个管道之前的字符都被“消耗”了:

> strsplit("word1|word2|word3\\|aha!|word4", "[^\\][|]")
[[1]]
[1] "word" "word" "word3\\|aha" "word4"

谁能建议一种方法来做到这一点?理想情况下,它应该被矢量化,因为有问题的文件非常大。

最佳答案

我相信这有效;使用 Anirudh 的反对答案(不知道为什么反对,它不起作用,但正则表达式是正确的)

strsplit(x, "(?<!\\\\)[|]", perl=TRUE)

## > strsplit(x, "(?<!\\\\)[|]", perl=TRUE)
## [[1]]
## [1] "word1" "word2" "word3\\|aha!" "word4"

关于regex - 在 R 中使用未转义的分隔符拆分字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17237005/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com