gpt4 book ai didi

r - 从字符串中删除重复单词的最短方法

转载 作者:行者123 更新时间:2023-12-05 08:21:34 28 4
gpt4 key购买 nike

我有这个字符串:

x <- c("A B B C")

[1] "A B B C"

我正在寻找最短的方法:

[1] "A B C"

我试过这个: Removing duplicate words in a string in R

paste(unique(x), collapse = ' ')

[1] "A B B C"
# does not work

背景:在数据框列中,我只想计算唯一字数。

最佳答案

基于 regex 的方法可能更短 - 匹配非空白字符 (\\S+) 后跟空白字符 (\\s), 捕获它,后跟一个或多个反向引用,并在替换中指定反向引用以仅返回匹配项的单个副本

gsub("(\\S+\\s)\\1+", "\\1", x)
[1] "A B C"

或者可能需要用strsplit拆分字符串,unlist,得到unique然后paste

paste(unique(unlist(strsplit(x, " "))), collapse = " ")
# [1] "A B C"

关于r - 从字符串中删除重复单词的最短方法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/72494229/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com