gpt4 book ai didi

r - 在 R 中提取字符串之前的数值

转载 作者:行者123 更新时间:2023-12-04 11:25:51 26 4
gpt4 key购买 nike

我一直在研究正则表达式字符串和 strsplit,但不知道如何解决我的问题。

我有一个 html 文档集合,其中始终包含短语“people own those”。我想提取紧邻该短语之前的数字。即“732,234 人拥有这些”-我希望捕获数字 732,234(包括逗号,尽管我不在乎它是否被删除)。数字和短语始终由 包围。我尝试使用 Xpath,但这似乎比正则表达式更难。非常感谢任何帮助或建议!

示例字符串:>742,811 人拥有这些<

-> 742,811

最佳答案

您可以尝试以下操作吗?

val <- "742,811 people own these"
gsub(' [a-zA-Z]+',"",val)

输出如下。

[1] "742,811"

说明:这里使用R的gsub(全局替换)函数。将条件放在此处,变量 val 应该用 NULL 替换所有出现的小写或大写字母空格。

关于r - 在 R 中提取字符串之前的数值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53292264/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com