gpt4 book ai didi

string - 如何使用R删除字符串中的重复字符?

转载 作者:行者123 更新时间:2023-12-03 13:19:37 26 4
gpt4 key购买 nike

我想用R实现一个功能,该功能可以删除字符串中的重复字符。例如,假设我的函数名为removeRS,那么它应该以这种方式工作:

  removeRS('Buenaaaaaaaaa Suerrrrte')
Buena Suerte
removeRS('Hoy estoy tristeeeeeee')
Hoy estoy triste

我的函数将与用西类牙语编写的字符串一起使用,因此查找具有三个以上连续元音的单词并不是那么普遍(至少正确)。不必理会他们背后的可能情绪。尽管如此,有些单词可以包含两个连续的辅音(尤其是ll和rr),但是我们可以从函数中跳过它。

因此,总而言之,此功能应将连续至少出现三次的字母替换为该字母。在上面的示例之一中, aaaaaaaaa替换为 a

您能给我任何提示用 R来执行此任务吗?

最佳答案

我对此并不十分谨慎,但这是我在正则表达式中使用引用的快速解决方案:

gsub('([[:alpha:]])\\1+', '\\1', 'Buenaaaaaaaaa Suerrrrte')
# [1] "Buena Suerte"
()首先捕获一个字母, \\1表示该字母, +表示匹配一次或多次;将所有这些部分放在一起,我们可以将一个字母匹配两次或更多次。

要包括字母数字之外的其他字符,请使用与您要包括的内容匹配的正则表达式替换 [[:alpha:]]

关于string - 如何使用R删除字符串中的重复字符?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11164667/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com