r - 如何用基础 R 做 str

r - 如何用基础 R 做 str_extract ？

转载作者：行者123 更新时间：2023-12-04 05:28:37

25

4

我正在平衡多个版本的 R，并希望根据我使用的 R 和操作系统来更改加载的 R 库。因此，我想坚持使用基本的 R 函数。

我正在阅读此页面以了解基本 R 相当于 stringr::str_extract曾是:

http://stat545.com/block022_regular-expression.html

它建议我可以用 grep 复制这个功能。 .但是，我一直无法获得grep如果匹配，则不只是返回整个字符串。这可以通过 grep 实现吗？单独使用，还是需要将其与其他功能结合使用？就我而言，我试图区分 CentOS 版本 6 和 7。

grep(pattern = "release ([0-9]+)", x = readLines("/etc/system-release"), value = TRUE)

最佳答案

1) strcapture 如果你想从 "release 1.2.3" 中提取一串数字和点然后使用基础

x <- "release 1.2.3"
strcapture("([0-9.]+)", x, data.frame(version = character(0)))
##   version
## 1   1.2.3

2) regexec/regmatches 还有 regmatches和 regexec但这已经包含在另一个答案中。

3) 子 通常也可以使用 sub :

sub(".* ([0-9.]+).*", "\\1", x)
## [1] "1.2.3"

3a) 如果您知道匹配是在开始或结束，则删除它之后或之前的所有内容:

sub(".* ", "", x)
## [1] "1.2.3"

4) gsub 有时我们知道要提取的字段有某些字符，它们不会出现在其他地方。在这种情况下，只需删除不能出现在字符串中的每个字符的每次出现:

gsub("[^0-9.]", "", x)
## [1] "1.2.3"

5) 读表人们通常可以将输入分解为字段，然后通过数字或通过 grep 挑选出所需的字段。 . strsplit , read.table或 scan可以使用:

read.table(text = x, as.is = TRUE)[[2]]
## [1] "1.2.3"

5a) grep/扫描

grep("^[0-9.]+$", scan(textConnection(x), what = "", quiet = TRUE), value = TRUE)
## [1] "1.2.3"

5b) grep/strsplit

grep("^[0-9.]+$", strsplit(x, " ")[[1]], value = TRUE)
## [1] "1.2.3"

6) 子串 如果我们知道字段的字符位置，我们可以使用 substring像这样:

substring(x, 9)
## [1] "1.2.3"

6a) 子字符串/正则表达式 或者我们可以使用 regexpr为我们定位字符位置:

substring(x, regexpr("\\d", x))
## [1] "1.2.3"

7) read.dcf 有时可以将输入转换为 dcf 形式，在这种情况下可以使用 read.dcf 读取。 .此类数据的格式为 name: value

 read.dcf(textConnection(sub(" ", ": ", x)))
 ##      release
 ## [1,] "1.2.3"

关于r - 如何用基础 R 做 str_extract ？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/47678725/

25

4

0

文章推荐： architecture - Lattix 架构分析工具

文章推荐： sublimetext2 - Sublime Text 用户首选项文件重写

文章推荐： apache-spark - Spark Streaming 缓存和转换

R str_extract 省略号前后的所有内容
我正在尝试找到一种方法，将中间带有省略号的字符列拆分为两列，省略号之前的所有内容和之后的所有内容。例如，如果我有: a [1] "60.4 (b)(33) and (e)(1) revised"
r - str_extract 仅捕获重复关键字的一个实例
当我在具有某个关键字的重复实例的字符串上使用 str_extract() 时，它只捕获其中一个。 > str_extract("1234cAc5678cAc90123", ".....A.....
regex - str_extract 特定模式(示例)
我仍然对正则表达式语法有些困惑。你能帮我解决这些模式吗: _A00_A1234B_ _A00_A12345B_ _A1_A12345_ 到目前为止我的方法: vapply(strsplit(files
r - stringr str_extract 捕获组捕获所有内容
我正在寻找从字符串中提取年份。这总是在“X”之后和“。”之前。然后是一串其他字符。使用 stringr的 str_extract我正在尝试以下操作: year = str_extract(strin
r - 如何从 str_extract 中提取精确的字符串？
我有一个名为 eventtext 的文本向量，我想从此向量中提取其中包含 "PR" 的值。然而，当我在真实数据上使用它时，我意识到我还选取了诸如 "PRESENT" 之类的值，因为该单词中包含 "PR
r - 如何用基础 R 做 str_extract ？
我正在平衡多个版本的 R，并希望根据我使用的 R 和操作系统来更改加载的 R 库。因此，我想坚持使用基本的 R 函数。我正在阅读此页面以了解基本 R 相当于 stringr::str_extract
regex - 字符串，str_extract : how to do positive lookbehind?
很简单的问题。我只需要使用正则表达式正向查找捕获一些字符串，但我没有找到一种方法来做到这一点。这是一个例子，假设我有一些字符串: library(stringr) myStrings result
regex - 如何在 R 中 str_extract 百分比？
从这个字符串 border-color:#002449;left:74.4%top;37%; 我想让第一个百分比 74.4% 成为一个名为 X 和第二个百分比 37% 一个名为 Y 的变量。我试过使
r - 在 R 中使用 str_extract 在带有正则表达式的子字符串之前提取数字
我想在stringr包中使用str_extract从XX nights etcetc形式的字符串中提取数字. 我目前正在这样做: library(stringr) str_extract("17 ni
r - str_extract : Extracting exactly nth word from a string
我知道这个问题已经在好几个地方问过了，但我没有看到这个问题的准确答案。所以我试图在正则表达式的帮助下从 R 中的字符串(“trying to”)中准确提取第二个单词。我不想使用 unlist(str
r - 将 stringr str_detect 管道传输到 str_extract 时出现问题 - extract 仅从第一行提取文本 : argument is not an atomic vector; coercing
我正在尝试创建一个新列，其中仅包含表达式中的某些数字数据。这是我的数据:https://pastebin.com/hYg3zqYz 我只需要第 12 列中“双极”之后的数字。这是有效的 p %
r - 将 stringr str_detect 管道传输到 str_extract 时出现问题 - extract 仅从第一行提取文本 : argument is not an atomic vector; coercing
我正在尝试创建一个新列，其中仅包含表达式中的某些数字数据。这是我的数据:https://pastebin.com/hYg3zqYz 我只需要第 12 列中“双极”之后的数字。这是有效的 p %

首页

博学

6Ren·AI

商城

r - 如何用基础 R 做 str_extract ？