R:带有矢量模式的 agrep-6ren

R:带有矢量模式的 agrep

转载作者：行者123 更新时间：2023-12-01 10:39:26

26

4

我有一个模式向量，需要对它们使用 agrep。问题是 agrep 似乎一次只采用一种模式。

patt <- c("test","10 Barrel")
lut  <- c("1 Barrel","10 Barrel Brewing","Harpoon 100 Barrel Series","resr","rest","tesr")

for (i in 1:length(patt)) {
  print(agrep(patt[i],lut,max=1,v=T))
}

结果:

[1] "rest" "tesr"
[1] "1 Barrel"                  "10 Barrel Brewing"         "Harpoon 100 Barrel Series"

for 在长模式上很慢，因此尝试以矢量化形式进行:

VecMatch1 = function(string, stringVector){
  stringVector[agrep(string, stringVector, max = 1)]
}
a = VecMatch1(patt,lut)

Warning message:
In agrep(string, stringVector, max = 1) :
  argument 'pattern' has length > 1 and only the first element will be used

lapply 之类的功能可能有帮助吗？谢谢!!

最佳答案

使用lapply:

lapply(patt, agrep, x=lut, max.distance=c(cost=1, all=1), value=TRUE)

[[1]]
[1] "rest" "tesr"

[[2]]
[1] "1 Barrel"                  "10 Barrel Brewing"         "Harpoon 100 Barrel Series"

您可能可以使用 dplyr 或 data.table 获得更快的性能。

关于R:带有矢量模式的 agrep，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/31435313/

26

4

0

文章推荐： r - 更改 ggplot 堆积面积图中的堆积顺序

文章推荐： java - IntelliJ 生成的 Ant 构建导致代码损坏

文章推荐： apache-spark - 使用并行化创建键/值对 RDD？

文章推荐： neo4j - GraphUnit - 事务集成测试和回滚

R: agrep 结果量词
是否有内置方法来量化 agrep 的结果？功能？例如。在 agrep("test", c("tesr", "teqr", "toar"), max = 2, v=T) [1] "tesr" "teqr
r - agrep 的问题
尽管我将 max.distance 限制为零，为什么 agrep 会找到匹配项？ adist 确实正确地告诉我，我需要两次插入... > agrep("ab", "abcd", max = list(
r - agrep:只返回最佳匹配
我在 R 中使用“agrep”函数，它返回匹配向量。我想要一个类似于 agrep 的函数，它只返回最佳匹配，或者如果存在平局则返回最佳匹配。目前，我正在对结果向量的每个元素使用“cba”包中的“sdi
R:带有矢量模式的 agrep
我有一个模式向量，需要对它们使用 agrep。问题是 agrep 似乎一次只采用一种模式。 patt 1 and only the first element will be used lapply
r - 从 agrep 中提取子串匹配
我的目标是确定是否给定 text有一个 target字符串，但我想允许拼写错误/小派生并提取“导致”匹配的子字符串(将其用于进一步的文本分析)。示例: target <- "target strin
r - `agrep(..., fixed=F)` 的困难
在?agrep(带有模糊匹配的grep)中，它提到我可以设置参数fixed=FALSE来解释我的模式作为正则表达式。但是，我无法让它工作! agrep('(asdf|fdsa)', 'asdf',
linux - shell - 显示 agrep 中最佳匹配的错误数
我正在尝试做的是使用 agrep 获取文件中最匹配的词和它的错误数。现在我只能使用这个脚本来获取单词: array=(bla1 bla2 bla3) for eachWord in "${array[
r - 使用 agrep() 对多个模式进行模糊名称匹配的更快 R 代码......？
我是一个 R 新手，一直在尝试使用 agrep 进行一些实验。 R 中的函数。我有一个庞大的客户数据库(150 万行)，我确信其中有很多重复项。尽管使用 table() 来获取重复确切名称的频率，但并
r - 如何在 adist 和 agrep 函数中设置成本参数？
我需要一些帮助来理解这些函数的参数。我从帮助中拿了例子。 ## To see the transformation counts for the Levenshtein distance: drop(
r - `data.table` 基于 `agrep` 选择子集的方法？
我正在尝试从 data.frame 转换至 data.table ，并且需要一些关于我正在尝试在单个列上执行的逻辑索引的建议。这是我有的一张表: places <- data.table(name=c
r - 通过名称模糊匹配创建唯一 ID(通过使用 R 的 agrep)
使用 R，我尝试匹配按年份和城市构建的数据集中的人名。由于一些拼写错误，无法精确匹配，因此我尝试使用 agrep() 来模糊匹配名称。数据集的示例 block 的结构如下: df <- data.f
r - R 中的 agrep - 在字符串中查找 *all* 匹配项(全局标志)
我有一个字符串: string <- "I do not like green eggs and ham!" 和一个图案 pattern <- "(egs|ham)" 我想知道多少次pattern匹配
java - 多次使用 agrep.exe 的 Java ProcessBuilder
我的Java程序需要启动agrep.exe，其参数包含大矩阵中所有元素对的参数，并获取两个字符串的匹配错误数。我写了一段代码，但是运行速度很慢。我可以加快这部分代码的速度吗？或者，也许你可以建议我一些
r - 如何使用 agrep 获得模糊字符串匹配的精确公共(public) "max.distance"值？
我正在尝试使用 agrep 找出两个字符串名称之间模糊字符串匹配的最佳精度。但是，由于字符串数量巨大，我需要选择一个精度“max.distance”以将其应用于我尝试匹配的所有字符串。不可能为我尝试
r - 与 R 中的 max.distance 相关的意外 agrep() 结果
编辑:这个错误是在 32 位版本的 R 中发现的，已在 R 版本 2.9.2 中得到修复。这是@leoniedu 今天发给我的推特，我没有他的答案，所以我想我会把它贴在这里。我已经阅读了 agre

首页

博学

6Ren·AI

商城

R:带有矢量模式的 agrep