gpt4 book ai didi

正则表达式如何删除主要字符和单词之间的空格

转载 作者:行者123 更新时间:2023-12-01 23:30:46 26 4
gpt4 key购买 nike

我正在处理来自 OCR 处理的原始文本

Antonio G uomez çapateyro 

我想删除主要字符和单词之间的空格:

Antonio Guomez çapateyro  

我尝试过的

(?:[A-Z])[\s]

text <- readLines("clipboard" , encoding = "latin1")
text2 <- gsub("(?:[A-Z])[\s]", "", text2)

我的问题:我可以将 G 与空格匹配,但我不知道如何删除空格

最佳答案

我们可以使用正后向匹配一个或多个空格(\\s+),前面有一个大写字母((?<=[A-Z])),并将其替换为''。 .

gsub("(?<=[A-Z])\\s+", "", str1, perl=TRUE)
#[1] "Antonio Guomez çapateyro"

或者无需任何环视,我们可以将大写字母捕获为一组后跟一个或多个空格,并将其替换为反向引用 ( \\1)。

sub("([A-Z])\\s+", "\\1", str1)
#[1] "Antonio Guomez çapateyro"

数据

str1 <- "Antonio G uomez çapateyro"

关于正则表达式如何删除主要字符和单词之间的空格,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37363534/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com