regex - 使用 gsub 和 regex 提取特定单词-6ren

regex - 使用 gsub 和 regex 提取特定单词

转载作者：行者123 更新时间：2023-12-01 09:48:53

25

4

跨越上一个问题，我在使用正确的 reg 表达式语法来隔离特定单词时遇到了问题。

给定一个数据框:

DL<-c("Dark_ark","Light-Lis","dark7","DK_dark","The_light","Lights","Lig_dark","D_Light")
Col1<-c(1,12,3,6,4,8,2,8)
DF<-data.frame(Col1)
row.names(DF)<-DL

我正在寻找从行名称中提取所有“Dark”和“Light”(忽略大写与小写)，并创建仅包含字符串“Dark”或“Light”的第二列

Col2<-c("Dark","Light","dark","dark","light","Light","dark","Light")
DF$Col2<-Col2

          Col1  Col2
Dark_ark     1  Dark
Light-Lis   12 Light
dark7        3  dark
DK_dark      6  dark
The_light    4 light
Lights       8 Light
Lig_dark     2  dark
D_Light      8 Light

我已经稍微更改了原始数据以详细说明我当前的问题，但是从 Tyler Rinker 那里得到了一个很好的答案，我使用了这个:

DF$Col2<-gsub("[^dark|light]", "", row.names(DF), ignore.case = TRUE)

但是 gsub 被一些共同的字母绊倒了。搜索留言板以使用正则表达式隔离确切的单词，看起来答案应该是使用双斜杠

\\<light\\>

或者

\\blight\\b

那么为什么这条线

DF$Col2<-gsub("[^\\<dark\\>|\\<light\\>]", "", row.names(DF), ignore.case = TRUE)

不拉上面所需的列？相反，我得到

          Col1    Col2
Dark_ark     1 Darkark
Light-Lis   12 LightLi
dark7        3    dark
DK_dark      6  DKdark
The_light    4 Thlight
Lights       8   Light
Lig_dark     2 Ligdark
D_Light      8  DLight

最佳答案

这个怎么样？

unlist(regmatches(rownames(DF), gregexpr("dark|light", rownames(DF), ignore.case=TRUE)))
# [1] "Dark"  "Light" "dark"  "dark"  "light" "Light" "dark"  "Light"

或者

gsub(".*(dark|light).*$", "\\1", row.names(DF), ignore.case = TRUE)
# [1] "Dark"  "Light" "dark"  "dark"  "light" "Light" "dark"  "Light"

关于regex - 使用 gsub 和 regex 提取特定单词，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/17913571/

25

4

0

文章推荐： push-notification - AWS SNS 终端节点自行禁用

文章推荐： java - Java构建时如何控制资源处理？

文章推荐： java - TreeMap in TreeMap ，无法从第二个 map 获取值

ruby - .gsub(/\..../, "").gsub(/$/, "").gsub(/$/,"").gsub(/\localhost/, "") <= 少数
我正在编写一个程序，它将从 who 命令中提取信息并格式化输出。普通 who 命令: user ip date (ip) user ip date (ip) user ip date (ip) us
bash - 根据不同的 gsub 条件同时 gsub 多列？
我有一个包含以下数据的文件- 输入- A B C D E F A B B B B B C A C D E F A B D E F A A A A A A F A B C B B B 如果从第 2 行开
R - 反转 gsub : keep only matches with gsub argument
这个问题在这里已经有了答案: How to prevent regmatches drop non matches? (4 个回答) 5年前关闭。我正在浏览一个字符向量(大约 10,000 个条目)
mysql - 未定义方法 `gsub' 对于 nil :NilClass or how to use gsub method in rails
我想连续生成一个Employee_ID，我已经在数据库表中修复了一个初始员工ID。格式为“E36162000”，我从表中获取最后一个员工 ID，然后仅提取整数值，然后加一，这将是下一个 employe
ruby-on-rails - Fixnum 上的 Gsub？未定义的方法 `gsub' 为 55 :Fixnum
使用以下函数，我转到一个站点，抓取一些信息，返回一些 JSON，并将其放入 @price 实例变量中。返回给我的 JSON 是一个数字，但是如果数字大于 1000，那么数字将包含一个逗号，所以我将其
java - # 的未定义方法 'gsub'
我在运行脚本时不断收到此错误。我对 Ruby 很陌生，所以请原谅我的傲慢。我正在使用内置了 JRuby 支持的 Nuix 编写脚本。这是我的代码； require 'benchmark' requ
r - gsub ) 仅当没有 (
我在 R 中工作，并且仅在没有左括号时才尝试删除右括号。我在下面尝试过，但没有返回所需的输出。 test <- data.frame(t1 = c("Book (Pg 1)", "Website On
R - gsub 从字符串中删除标点符号和数字
我正在尝试从 Chandler 中删除标点符号和数字成为Chandler .这是我目前正在尝试的: df$city <- gsub("[[:punct:]]|[[:digit:]]", "", df$
r - gsub 中的反向引用评估时间
我正在尝试生成结合 n 个高斯的函数，并使用从 nls 中检索到的值跑。我用 gsub用 nls 替换原始系数那些使用反向引用的。然而，似乎[在 \\1 之前对 datafame 进行评估. 这是一个
regex - gsub() 除指定字符外的所有内容？
这个问题在这里已经有了答案: What regex will match every character except comma ',' or semi-colon ';'? (4 个回答) 5年前
regex - 非贪婪 gsub
我有一个日志数据集: V1 duration id startpoint T161[=]Pexplorer.exe[=]I1820[=]W20094[=]V6.00.2900.5512 777
Lua gsub 第二个实例
我正在使用 local mystring = 'Thats a really nice house.' string.gsub(mystring,"% ", "/",1) 用斜杠替换第一个空格字符。
regex - gsub 的倒数
我有一些正在使用的 html 代码。我想提取某些字符串。我想使用从字符串 x 中提取它的首选基础 R :coleman_l, SMOG4 这是我所拥有的: x (hi)auto(coleman_l
R gsub 部分替换通配符
我希望这是足够不同的相关，之前的帖子来证明它自己的线程是合理的；不幸的是，他们对我没有帮助。我认为我对部分替换的兴趣，加上通配符的使用迄今为止是独一无二的，但如果我只是没有足够仔细地搜索或阅读，我深表
regex - “gsub”如何处理空格？
我有一个字符串"ab b cde"，即"ab[space]b[space]cde"。我想用空格替换“space-b”和“space-c”，以便输出字符串为"ab[space][space][space
r - gsub，括号内的内容偶尔由换行符而不是右括号
我正在尝试清理一些文本字符串，以便我可以干净地解析出一些脚本信息。对于这些表格，括号中的信息表示脚本的位置或阻塞注释。我想获取所有括号内的信息，并删除括号及其所有包含的字符。工作中的关键在于，由于数
r - gsub 删除不需要的精度
任何人都可以通过 gsub 帮助实现以下目标在R？ input string: a=5.00,b=120,c=0.0003,d=0.02,e=5.20, f=1200.0,g=850.02 desir
仅使用 gsub 替换表达式以外的所有字符
给定字符串: smple_paths <- c("/path/path/path/abc22/path/path", "/apath/apath/paath/abc1
lua - 如何使用带有特殊字符的 gsub
似乎当我添加一个特殊字符时 gsub 不再适合我。我如何使用带有此类字符的文本 print(string.gsub("a !foo walking", "%a+",{ ["!foo"] =
r - 如何通过循环中的名称列表进行 gsub
我有一批样本要提交给我的大学集群进行处理。我有超过 1000 个样本需要运行。不必手动创建脚本，我想知道我可以制作一个 for 循环来替换示例 ID。每个脚本本质上是相同的，我只需要更改示例 ID 和

首页

博学

6Ren·AI

商城

regex - 使用 gsub 和 regex 提取特定单词