gpt4 book ai didi

r - 如何在 R 正则表达式中打印/查看预定义模式 [ :alnum:], [ :punct:], [ :digit:], [ :blank:] etc. ]

转载 作者:行者123 更新时间:2023-12-02 05:09:26 24 4
gpt4 key购买 nike

在哪里可以看到 R 中正则表达式的预定义模式的代码?文档说它与 locales/POSIX locale 有关。

   > [[:alpha:]]
> [:alpha:]

不打印任何内容。如何查找预定义的模式以及它应该匹配多少次的函数等。

非常感谢任何帮助。

最佳答案

首先我们阅读help("regex"):

[:lower:]
Lower-case letters in the current locale.

[:upper:][:alpha:] 类似,只是它们的并集。

然后我们可以检查当前语言环境的字符集:

Sys.getlocale("LC_CTYPE")
#[1] "German_Germany.1252"

l10n_info()
#$MBCS
#[1] FALSE
#
#$`UTF-8`
#[1] FALSE
#
#$`Latin-1`
#[1] TRUE
#
#$codepage
#[1] 1252

然后我们可以上网,例如至 Wikipedia .

那么我们可以试试这个:

gsub("[^[:alpha:]]", "", rawToChar(as.raw(1:(16^2-1))))
#[1] "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyzÀÁÂÃÄÅÆÇÈÉÊËÌÍÎÏÐÑÒÓÔÕÖØÙÚÛÜÝÞßàáâãäåæçèéêëìíîïðñòóôõöøùúûüýþÿ"
gsub("[^[:cntrl:]]", "", rawToChar(as.raw(1:(16^2-1))))
#[1] "\001\002\003\004\005\006\a\b\t\n\v\f\r\016\017\020\021\022\023\024\025\026\027\030\031\032\033\034\035\036\037\177€‚ƒ„…†‡ˆ‰Š‹ŒŽ‘’“”•–—˜™š›œžŸ"

关于r - 如何在 R 正则表达式中打印/查看预定义模式 [ :alnum:], [ :punct:], [ :digit:], [ :blank:] etc. ],我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39610565/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com