- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有两个向量,每个向量都包含一系列字符串。例如,
V1=c("pen", "document folder", "warn")
V2=c("pens", "copy folder", "warning")
我需要找出哪两个最匹配。我直接使用编辑距离。但这还不够好。就我而言,钢笔和钢笔的含义应该相同。文档文件夹和复制文件夹可能是同一个东西。 warn 和 warning 其实是一样的。我正在尝试使用像 tm 这样的软件包。但我不太确定哪些函数适合这样做。谁能告诉我这个吗?
最佳答案
根据我的经验,余弦匹配对于此类工作来说是一个很好的匹配:
V1 <- c("pen", "document folder", "warn")
V2 <- c("copy folder", "warning", "pens")
result <- sapply(V1, function(x) stringdist(x, V2, method = 'cosine', q = 1))
rownames(result) <- V2
result
pen document folder warn
copy folder 0.6797437 0.2132042 0.8613250
warning 0.6150998 0.7817821 0.1666667
pens 0.1339746 0.6726732 0.7500000
当距离足够近时,您必须定义一个截止点,距离有多小,它们匹配得越好。您还可以使用 Q 参数,该参数表示应相互比较多少个字母组合。例如:
result <- sapply(V1, function(x) stringdist(x, V2, method = 'cosine', q = 3))
rownames(result) <- V2
result
pen document folder warn
copy folder 1.0000000 0.5377498 1.0000000
warning 1.0000000 1.0000000 0.3675445
pens 0.2928932 1.0000000 1.0000000
关于r - 模糊匹配两个字符串 ur r,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40299192/
我有这样的东西。 "data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAAKQAAACkCAYAAAAZtYVBAAAgAElEQ…TFHIWRhe2sii/S
我有两个向量,每个向量都包含一系列字符串。例如, V1=c("pen", "document folder", "warn") V2=c("pens", "copy folder", "warning
我有两个向量,每个向量都包含一系列字符串。例如, V1=c("pen", "document folder", "warn") V2=c("pens", "copy folder", "warning
我是 C 编程的新手,我一直在尝试编写一个程序来向自身发送消息、接收消息并发回消息。我找到了一个 example一个客户端和服务器程序,基本上只是复制它,试图做一些改变。该程序不仅崩溃,而且输出“你的
在下面的C++代码中,uR是什么意思? #include using namespace std; int main() { cout << uR"(Hello, world!)" << '
我有这个声纳错误主要: Found 'UR'-anomaly for variable 'language' (lines '83'-'85') 在这个函数中: public void saveAll
在获取实际文本时,执行以下功能没有问题: In [7]: str = ur"FOO 20\N40%" In [8]: str Out[8]: u'FOO 20\\N40%' 但在实际情况中,单词“FO
看着这个答案 ( https://stackoverflow.com/a/2856961/1793629 ) 我认为 Ur/Web 是一个非常安全的平台。 现在查看此基准 (http://www.te
我有一些用旧版本的 python(2.x) 编写的 python 代码,我很难让它工作。我正在使用 python 3.4 _eng_word = ur"[a-zA-Z][a-zA-Z0-9'.]*"
在 zos db2 中,如果您在 sql 中没有指定任何隔离级别更改子句,则在执行 select 时将创建一个锁,然后您必须调用 commit 或 rollback,否则就会被绑定(bind)资源。
以下代码帮助我将客户查找设置为联系人而不是帐户。 document.getElementById("customerid").setAttribute("defaulttype", "2"); 在 I
我想确认这是否是 PMD 的错误?如果是,我如何提交票证。 public static void main(final String[] args) { for (final
我试图在进入 db2 的每个查询中使用“ WITH UR ”。有人知道如何在 db2 ef4 中使用事务隔离吗?我希望 linq 为我创建以下查询: SELECT EmployeeID FROM Pa
我的情况是。我有一个计划在 ASP.NET MVC 2 上构建的项目。主要要求之一是 SEO 优化。客户希望为此项目使用以 .html 扩展名结尾的类静态 URL,使 URL 对 SEO 更友好。例如
本周我从 UR 11 升级到 UR 12,在测试我的环境时遇到了一些问题。我已经运行了自定义代码验证工具并修复了大多数可能的 JS 相关问题,并将代码更改为使用 XrmServiceToolkit 而
这个问题已经有答案了: What exactly do "u" and "r" string prefixes do, and what are raw string literals? (7 个回答
我必须重新制作 FetchUtil.js 才能在 CRM 2011 UR 12 中使用它。我的 javascript 不是很好,所以我需要一些帮助。 这是原生代码 var sFetchResult
在最新的 R (3.4) 和 RStudio 1.0.143 中运行 install.packages 时,我收到以下警告 Warning in install.packages : cannot
我遇到了这个错误: Warning: A path must be pathname + search + hash only, not a full URL like "http://www.sha
我在使用 Axis2 的 SOAP Web 服务客户端时遇到问题;扩展 WSDL 的 XSD 文件包含响应中元素的以下定义,请注意如何定义无类型: 以下是 SOAP 服务返回的实际响应: U
我是一名优秀的程序员,十分优秀!