gpt4 book ai didi

使用 POSIX 字符类删除 R 中字符之间的下划线以外的所有标点符号

转载 作者:行者123 更新时间:2023-12-04 08:50:20 25 4
gpt4 key购买 nike

我想使用 R 删除单词之间的所有下划线。最后,代码会删除单词末尾或开头的下划线。结果应该是'hello_world 和 hello_world'。我想使用那些预先构建的类。没错,我已经学会使用以下代码来期待特定字符,但我不知道如何使用单词边界序列。

test<-"hello_world and _hello_world_"
gsub("[^_[:^punct:]]", "", test, perl=T)

最佳答案

你可以使用

gsub("[^_[:^punct:]]|_+\\b|\\b_+", "", test, perl=TRUE)

参见 regex demo

详细信息:

  • [^_[:^punct:]] - 除了 _
  • 之外的任何标点符号
  • | - 或者
  • _+\b - 单词末尾的一个或多个_
  • | - 或者
  • \b_+ - 单词开头的一个或多个_

关于使用 POSIX 字符类删除 R 中字符之间的下划线以外的所有标点符号,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/64135363/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com