r - 向量化 Gsub 的问题-6ren

r - 向量化 Gsub 的问题

转载作者：行者123 更新时间：2023-12-05 01:08:35

26

4

目的:
我是新人R ，但我试图让自己熟悉 R 中的编程.在当前的任务中，我想替换出现在 corpus 中的多个单词。同时保持 corpus 的结构.
Gsub不允许向量用于模式和相应的替换，所以我决定写一个修改过的 Gsub功能。 (我知道 Gsubfn 函数，但我也想培养一些编程技能。)

数据生成

a<- c("this is a testOne","this is testTwo","this is testThree","this is testFour")
corpus<- Corpus(VectorSource(a))
pattern1<- c("testOne","testTwo","testThree")
replacement1<- c("gameOne","gameTwo","gameThree")

修改 Gsub

gsub2<- function(myPattern, myReplacement, myCorpus, fixed=FALSE,ignore.case=FALSE){
for (i in 1:length(myCorpus)){
    for (j in 1:length(myPattern)){
    myCorpus[[i]]<- gsub(myPattern[j],myReplacement[j], myCorpus[[i]], fixed=TRUE)
    }
}
}

代码执行

gsub2(pattern1,replacement1,corpus,fixed=TRUE)

但是，实际语料库中没有产生任何变化。我认为这是因为所有更改都在函数内进行，因此仅限于函数内。然后我尝试返回语料库，但 R无法识别语料库对象。

有人能指出我正确的方向吗？
谢谢。

最佳答案

尝试使用 mapply :

# original data
corpus <- c("this is a testOne","this is testTwo","this is testThree","this is testFour")
# make a copy to gsub into
corpus2 <- corpus

# set pattern/replacement
pattern1<- c("testOne","testTwo","testThree")
replacement1<- c("gameOne","gameTwo","gameThree")

corpus2 # before gsub
# run gsub on all of the patterns/replacements
x <- mapply(FUN= function(...) {
     corpus2 <<- gsub(...,x=corpus2)},
     pattern=pattern1, replacement=replacement1)
rm(x) # discard x; it's empty
corpus2 # after gsub

关于r - 向量化 Gsub 的问题，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/17041981/

26

4

0

文章推荐： visual-studio-2012 - 在升级到 .Net 4.5 + VS 2012 时似乎中断

文章推荐： angularjs - 子 ng-click 不触发

文章推荐： perl - 如何在 perl 中重新打开 STDIN <>？

文章推荐： merge - 如何只 merge 一些文件？

ruby - .gsub(/\..../, "").gsub(/$/, "").gsub(/$/,"").gsub(/\localhost/, "") <= 少数
我正在编写一个程序，它将从 who 命令中提取信息并格式化输出。普通 who 命令: user ip date (ip) user ip date (ip) user ip date (ip) us
bash - 根据不同的 gsub 条件同时 gsub 多列？
我有一个包含以下数据的文件- 输入- A B C D E F A B B B B B C A C D E F A B D E F A A A A A A F A B C B B B 如果从第 2 行开
R - 反转 gsub : keep only matches with gsub argument
这个问题在这里已经有了答案: How to prevent regmatches drop non matches? (4 个回答) 5年前关闭。我正在浏览一个字符向量(大约 10,000 个条目)
mysql - 未定义方法 `gsub' 对于 nil :NilClass or how to use gsub method in rails
我想连续生成一个Employee_ID，我已经在数据库表中修复了一个初始员工ID。格式为“E36162000”，我从表中获取最后一个员工 ID，然后仅提取整数值，然后加一，这将是下一个 employe
ruby-on-rails - Fixnum 上的 Gsub？未定义的方法 `gsub' 为 55 :Fixnum
使用以下函数，我转到一个站点，抓取一些信息，返回一些 JSON，并将其放入 @price 实例变量中。返回给我的 JSON 是一个数字，但是如果数字大于 1000，那么数字将包含一个逗号，所以我将其
java - # 的未定义方法 'gsub'
我在运行脚本时不断收到此错误。我对 Ruby 很陌生，所以请原谅我的傲慢。我正在使用内置了 JRuby 支持的 Nuix 编写脚本。这是我的代码； require 'benchmark' requ
r - gsub ) 仅当没有 (
我在 R 中工作，并且仅在没有左括号时才尝试删除右括号。我在下面尝试过，但没有返回所需的输出。 test <- data.frame(t1 = c("Book (Pg 1)", "Website On
R - gsub 从字符串中删除标点符号和数字
我正在尝试从 Chandler 中删除标点符号和数字成为Chandler .这是我目前正在尝试的: df$city <- gsub("[[:punct:]]|[[:digit:]]", "", df$
r - gsub 中的反向引用评估时间
我正在尝试生成结合 n 个高斯的函数，并使用从 nls 中检索到的值跑。我用 gsub用 nls 替换原始系数那些使用反向引用的。然而，似乎[在 \\1 之前对 datafame 进行评估. 这是一个
regex - gsub() 除指定字符外的所有内容？
这个问题在这里已经有了答案: What regex will match every character except comma ',' or semi-colon ';'? (4 个回答) 5年前
regex - 非贪婪 gsub
我有一个日志数据集: V1 duration id startpoint T161[=]Pexplorer.exe[=]I1820[=]W20094[=]V6.00.2900.5512 777
Lua gsub 第二个实例
我正在使用 local mystring = 'Thats a really nice house.' string.gsub(mystring,"% ", "/",1) 用斜杠替换第一个空格字符。
regex - gsub 的倒数
我有一些正在使用的 html 代码。我想提取某些字符串。我想使用从字符串 x 中提取它的首选基础 R :coleman_l, SMOG4 这是我所拥有的: x (hi)auto(coleman_l
R gsub 部分替换通配符
我希望这是足够不同的相关，之前的帖子来证明它自己的线程是合理的；不幸的是，他们对我没有帮助。我认为我对部分替换的兴趣，加上通配符的使用迄今为止是独一无二的，但如果我只是没有足够仔细地搜索或阅读，我深表
regex - “gsub”如何处理空格？
我有一个字符串"ab b cde"，即"ab[space]b[space]cde"。我想用空格替换“space-b”和“space-c”，以便输出字符串为"ab[space][space][space
r - gsub，括号内的内容偶尔由换行符而不是右括号
我正在尝试清理一些文本字符串，以便我可以干净地解析出一些脚本信息。对于这些表格，括号中的信息表示脚本的位置或阻塞注释。我想获取所有括号内的信息，并删除括号及其所有包含的字符。工作中的关键在于，由于数
r - gsub 删除不需要的精度
任何人都可以通过 gsub 帮助实现以下目标在R？ input string: a=5.00,b=120,c=0.0003,d=0.02,e=5.20, f=1200.0,g=850.02 desir
仅使用 gsub 替换表达式以外的所有字符
给定字符串: smple_paths <- c("/path/path/path/abc22/path/path", "/apath/apath/paath/abc1
lua - 如何使用带有特殊字符的 gsub
似乎当我添加一个特殊字符时 gsub 不再适合我。我如何使用带有此类字符的文本 print(string.gsub("a !foo walking", "%a+",{ ["!foo"] =
r - 如何通过循环中的名称列表进行 gsub
我有一批样本要提交给我的大学集群进行处理。我有超过 1000 个样本需要运行。不必手动创建脚本，我想知道我可以制作一个 for 循环来替换示例 ID。每个脚本本质上是相同的，我只需要更改示例 ID 和

首页

博学

6Ren·AI

商城

r - 向量化 Gsub 的问题