- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我找到了很多确定两个字符串之间编辑距离 (LD) 的来源。然而,它们都假设替换、插入和删除操作的成本都设置为 1。
这source for C++ 非常高效,我正在尝试在下面进行调整以允许每次操作的不同成本。
#include <vector>
#include <string>
#include <iostream>
size_t levenshtein_distance(const std::string &a, const std::string &b);
int main()
{
std::string a, b;
a = "roger"; b = "Roger";
std::cout << levenshtein_distance(a, b) << std::endl;
a = "roger"; b = "oger";
std::cout << levenshtein_distance(a, b) << std::endl;
a = "oger"; b = "roger";
std::cout << levenshtein_distance(a, b) << std::endl;
return 0;
}
size_t levenshtein_distance(const std::string &a, const std::string &b)
{
// Costs of operations
const size_t substitution = 5;
const size_t deletion = 2;
const size_t insertion = 2;
size_t a_size = a.size(), b_size = b.size();
std::vector<size_t> P(b_size + 1), Q(b_size + 1);
for (size_t i = 0; i < Q.size(); i++)
Q[i] = i;
for (size_t i = 0; i < a_size; i++)
{
P[0] = i + 1;
for (size_t j = 0; j < b_size; j++)
P[j + 1] = std::min(
std::min(Q[j + 1] + 1, P[j] + 1), Q[j] + ((a[i] == b[j])? 0: substitution));
P.swap(Q);
}
return Q[b_size];
}
我想我在正确的地方有substitution
。如果我将它更改为 5,它会为该操作提供相应大的 LD,但似乎无法找到在哪里应用 insertion
或 deletion
。我尝试更改文字 1
,但它们似乎没有任何效果 - 对于插入或删除操作,结果始终为 1。
最佳答案
您可以按如下方式改编来自维基百科的算法:
size_t levenshtein_distance(const std::string &s1, const std::string &s2)
{
const size_t substitution = 5;
const size_t deletion = 2;
const size_t insertion = 3;
const size_t len1 = s1.size(), len2 = s2.size();
vector<vector<unsigned int> > d(len1 + 1, vector<unsigned int>(len2 + 1));
d[0][0] = 0;
for(unsigned int i = 1; i <= len1; ++i) d[i][0] = deletion * i;
for(unsigned int i = 1; i <= len2; ++i) d[0][i] = insertion * i;
for(unsigned int i = 1; i <= len1; ++i)
for(unsigned int j = 1; j <= len2; ++j)
d[i][j] = std::min(
std::min(d[i - 1][j] + deletion, d[i][j - 1] + insertion),
d[i - 1][j - 1] + (s1[i - 1] == s2[j - 1] ? 0 : substitution)
);
return d[len1][len2];
}
例如d[i][0]
表示将第一个字符串的前i
个字符转换为第二个字符串的零个第一个字符的成本。这显然来自删除,所以 d[i][0] = deletion * i
。同样,d[0][i] = insertion * i
。
如果不想使用二维数组,那么只能保留最后一行:
int levenshtein_distance(const std::string &s1, const std::string &s2)
{
const int substitution = 5;
const int deletion = 2;
const int insertion = 3;
const int len1 = s1.size(), len2 = s2.size();
std::vector<int> P(len2 + 1), Q(len2 + 1);
for(int j = 1; j <= len2; ++j) P[j] = insertion * j;
for(int i = 1; i <= len1; ++i) {
Q[0] = deletion * i;
for(int j = 1; j <= len2; ++j) {
Q[j] = std::min(Q[j - 1] + insertion, P[j] + deletion);
Q[j] = std::min(Q[j], P[j - 1] +
(s1[i - 1] == s2[j - 1] ? 0 : substitution)
);
}
std::swap(P, Q);
}
return P[len2];
}
关于c++ - 修改现有的 Levenshtein 距离代码以适应不同的操作成本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29017600/
前言: 有时候,一个数据库有多个帐号,包括数据库管理员,开发人员,运维支撑人员等,可能有很多帐号都有比较大的权限,例如DDL操作权限(创建,修改,删除存储过程,创建,修改,删除表等),账户多了,管理
这个问题已经有答案了: Condition variable deadlock (2 个回答) 已关闭 5 年前。 在研究多线程时,我编写了以下代码,但在屏幕上没有观察到输出。我在这里做错了什么?我期
复制代码 代码如下: <IfModule mod_rewrite.c> RewriteEngineOn RewriteBase/ #将www.zzvips.com跳转到www.zzv
复制代码 代码如下: <IfModule mod_rewrite.c> RewriteEngine On RewriteBase / # 把 www.zzvips.com
复制代码 代码如下: Const T_GATEWAY = "1.1.1.1" '网关 Const T_NEWDNS1 = "2.2.2.2" 'DNS1
0. 修改索引 大文本字段支持排序 PUT http://localhost:9200/lrc_blog/_mapping //请求体 { "properties": { "title": { "t
仅 react 当状态发生变化时重新渲染 . 那么为什么我会直接看到我对真实 DOM 所做的更改呢? 我知道我正在修改真实的 DOM,但是当我根本没有改变状态时触发重新渲染的是什么。 import R
Xcode beta 5 推出 @FetchRequest对于 SwiftUI。 我有一个 View ,它有一个 @FetchRequest . NSFetchRequest是在管理器中创建的,该管理
关闭。这个问题需要更多 focused .它目前不接受答案。 想改进这个问题?更新问题,使其仅关注一个问题 editing this post . 7年前关闭。 Improve this questi
我有一个表达式[text][id]应替换为链接 text 解决方案是( id 是整数) $s = preg_replace("/\[([^\]]+)(\]*)\]\[([0-9]+)\]/","$1$
我在 repo 中有一个文件,我不想让任何人更新。 我能做什么? 最佳答案 你想要svn锁:http://www.linxit.de/svnbook/en/1.2/svn.ref.svn.c.lock
说我有项目 list 。我想导出到csv,但在此之前我想做一些计算/修改。 基本上,设置如下所示: PS C:\Files> gci Directory: C:\Files Mode
我有一个非常简单的问题 - 是否可以修改 Java API 的源代码,例如Junit,JABX ? 我知道这似乎是一个非常愚蠢的问题,但它一直困扰着我一段时间。 最佳答案 如果您可以掌握源代码,那么请
我有一个带有变量/列的小标题,其中包括不同形状的小标题列表。我想为其中一个变量中的每个(子)标题添加一个变量/列。 例如此类数据 library("tibble") aaa aaa # A tibb
我有几个菜单,可以在单击时向当前链接添加变量。这是一个例子: 1 2 3 x y z 我的问题是,如果我选择“y”2次,它会添加“&cord=y”2次。相反,我希望它替
我有两个项目:一个服务项目和一个服务安装程序项目。服务项目具有适合我的产品的装配信息。它包括公司信息和正确的服务名称。一旦服务实际安装,所有这些似乎都会被忽略。安装服务时,它使用在服务安装程序的ini
以下代码何时可能产生副作用? @some = map { s/xxx/y/; $_ } @some; perlcritic 将其解释为危险的,因为例如: @other = map { s/xxx/y/
我想知道以下哪种解决方案更好:我想修改一些 .class 文件,我意识到有两种方法可以做到这一点: 反编译.class文件,修改它,最后再次编译。 - 直接用十六进制编辑器修改。 谢谢 最佳答案 在这
这是我的按钮代码 onclick 我希望我的程序等待用户单击一个 JPanel,并且当用户单击 JPanel 时,它应该在控制台上打印其名称。 此按钮代码未显示输出 JPopupMenu popu
我正在使用一个具有“getName()”方法的特定 API。 getName() 返回一个字符串。是否可以修改该字符串? API 中不包含修饰符方法,并且 String getName() 返回的是私
我是一名优秀的程序员,十分优秀!