- android - RelativeLayout 背景可绘制重叠内容
- android - 如何链接 cpufeatures lib 以获取 native android 库?
- java - OnItemClickListener 不起作用,但 OnLongItemClickListener 在自定义 ListView 中起作用
- java - Android 文件转字符串
我在 C++ 中实现了 Damerau–Levenshtein 距离,但它没有为输入(pantera,主动脉)提供正确的 o/p,正确的 o/p 是 4,但我的代码给出了 5......
int editdist(string s,string t,int n,int m)
{
int d1,d2,d3,cost;
int i,j;
for(i=0;i<=n;i++)
{
for(j=0;j<=m;j++)
{
if(s[i+1]==t[j+1])
cost=0;
else
cost=1;
d1=d[i][j+1]+1;
d2=d[i+1][j]+1;
d3=d[i][j]+cost;
d[i+1][j+1]=minimum(d1,d2,d3);
if(i>0 && j>0 && s[i+1]==t[j] && s[i]==t[j+1] ) //transposition
{
d[i+1][j+1]=min(d[i+1][j+1],d[i-1][j-1]+cost);
}
}
}
return d[n+1][m+1];
}
我没有看到任何错误。有人能找到代码的问题吗?
最佳答案
帖子中的算法不计算 Damerau-Levenshtein 距离。在 wikipedia article该算法被定义为最佳字符串对齐距离。
DL 距离算法的 java 实现可以在另一个 SO post 中找到.
要获得正确的 OSA 距离值,请将下面标有 -
的行更改为标有 +
的行
int editdist(string s,string t,int n,int m)
{
int d1,d2,d3,cost;
int i,j;
for(i=0;i<=n;i++)
{
for(j=0;j<=m;j++)
{
- if(s[i+1]==t[j+1])
+ if(s[i+1]==t[j+1])
cost=0;
else
cost=1;
d1=d[i][j+1]+1;
d2=d[i+1][j]+1;
d3=d[i][j]+cost;
d[i+1][j+1]=minimum(d1,d2,d3);
- if(i>0 && j>0 && s[i+1]==t[j] && s[i]==t[j+1] ) //transposition
+ if(i>0 && j>0 && s[i]==t[j-1] && s[i-1]==t[j] ) //transposition
{
d[i+1][j+1]=min(d[i+1][j+1],d[i-1][j-1]+cost);
}
}
}
return d[n+1][m+1];
}
看起来好像代码是从用默认情况下数组索引从 1 开始的编程语言编写的程序中复制的。因此,所有对距离数组 d
元素的引用都会递增。但是,对字符串中字符的引用是对从 0 开始的数组的引用,因此不应更新它们。
要计算距离,必须正确初始化距离数组:
for( i = 0; i < n + 1; i++)
d[i][0] = i;
for( j = 1; j < m + 1; j++)
d[0][j] = j;
既然你得到了答案 5,你的距离数组可能已经正确初始化了。
由于上述算法不计算 DL 距离,这里是 DL 算法的 C 实现的草图(源自 SO 帖子,其中包含从维基百科文章中的 ActionScript 实现派生的 java 实现)。
#define d(i,j) dd[(i) * (m+2) + (j) ]
#define min(x,y) ((x) < (y) ? (x) : (y))
#define min3(a,b,c) ((a)< (b) ? min((a),(c)) : min((b),(c)))
#define min4(a,b,c,d) ((a)< (b) ? min3((a),(c),(d)) : min3((b),(c),(d)))
int dprint(int* dd, int n,int m){
int i,j;
for (i=0; i < n+2;i++){
for (j=0;j < m+2; j++){
printf("%02d ",d(i,j));
}
printf("\n");
}
printf("\n");
return 0;
}
int dldist2(char *s, char* t, int n, int m) {
int *dd;
int i, j, cost, i1,j1,DB;
int INFINITY = n + m;
int DA[256 * sizeof(int)];
memset(DA, 0, sizeof(DA));
if (!(dd = (int*) malloc((n+2)*(m+2)*sizeof(int)))) {
return -1;
}
d(0,0) = INFINITY;
for(i = 0; i < n+1; i++) {
d(i+1,1) = i ;
d(i+1,0) = INFINITY;
}
for(j = 0; j<m+1; j++) {
d(1,j+1) = j ;
d(0,j+1) = INFINITY;
}
dprint(dd,n,m);
for(i = 1; i< n+1; i++) {
DB = 0;
for(j = 1; j< m+1; j++) {
i1 = DA[t[j-1]];
j1 = DB;
cost = ((s[i-1]==t[j-1])?0:1);
if(cost==0) DB = j;
d(i+1,j+1) =
min4(d(i,j)+cost,
d(i+1,j) + 1,
d(i,j+1)+1,
d(i1,j1) + (i-i1-1) + 1 + (j-j1-1));
}
DA[s[i-1]] = i;
dprint(dd,n,m);
}
cost = d(n+1,m+1);
free(dd);
return cost;
}
关于c++ - Damerau–Levenshtein distance (Edit Distance with Transposition) c实现,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10727174/
按照目前的情况,这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持,但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visit the
我已经检查了问题、源代码和其他示例,但我终究无法理解 Distance d = Distance() 是什么。参数在函数中的意思 template int flann::hierarchicalClu
从 GeoDjango Point Field,我得到以下几点: object1.point = "POINT(-113.4741271000000040 53.4235217000000020)"
这是在与@Nargiza 解决此问题的过程中出现的意外行为:3d distance calculations with GeoDjango . 遵循 Distance 上的 Django 文档函数:
我在 C++ 中实现了 Damerau–Levenshtein 距离,但它没有为输入(pantera,主动脉)提供正确的 o/p,正确的 o/p 是 4,但我的代码给出了 5...... int e
嘿,各位极客们! 我对 Web 3.0 有一个革命性的想法,呵呵。我将创建一个像 jQuery-UI 一样的 SVG-UI-lib。为了使某些功能成为可能,我需要 fork /贡献 d3.js。IE。
我有一个列表,其中包含具有 3D 名称和坐标的点列表。类似这样的列表长度要长得多: group=[[gr1, 5, 8, 9], [gr2, 7, 4, 5], [gr3, 3, 8, 1], [gr
我是 OOP 的新手,我在这个任务中一直遇到这个错误。或许你能帮帮我。 这是类头文件: class Distance : public Magnitude { private: double
Django——地质学 我正在寻找如何定义两点之间的距离。第一个与帖子本身有关,不会因每个帖子而改变。它表示帖子的位置。第二个将与用户的位置相关联。 我想计算发布和用户的距离。 问题:假设我已连接:每
当使用短语运算符( )语法进行全文搜索时,它并没有像我期望的那样“小于或等于”数字。搜索值必须正好位于那么多位置之外。 给出这个例子: select * from (values ('bob i
假设我有两个由纬度和经度表示的位置。 位置1:37.5613 , 126.978地点 2 : 37.5776 , 126.973 如何使用曼哈顿距离计算距离? 编辑:我知道计算曼哈顿距离的公式,如 E
我有两个我知道纬度和经度的点。 我如何计算它们之间的距离(以公里和英里为单位)。公式是什么? 最佳答案 您可以使用 haversine formula来计算这样的距离。 关于distance - 以公
我搜索了 A* 的算法/伪代码,然后对其进行了编码。我使用曼哈顿距离作为 h(n)。 ( f(n) = g(n) + h(n) ) 这就是结果, 当没有墙挡路时总是会发生这种情况,但是当我放置很多墙时
我正在寻找一种数据结构来处理包含 512 个二进制值的数十亿个二进制字符串。 我的目标是向结构发送查询并获得一个结果集,其中包含距离更短的所有数据。 我的第一个想法是使用 kd 树。但是这些树对于高维
无线测量相距几米的两个物体(计算机、智能手机或专用设备)之间的距离的最佳方法是什么,精确到约 10 厘米? 这是否可以通过在 WLAN、蓝牙或 GPS 上小 pig 乞求来实现? 最佳答案 Ekaha
给定一个四元数值,我想在一组四元数中找到它的最近邻居。为此,我显然需要一种方法来比较两个四元数之间的“距离”。这种比较需要什么距离表示以及如何计算? 谢谢 乔什 最佳答案 这是一个老问题,但似乎需要更
我们如何测量分类数据之间的相似度距离? 示例:性别:男、女数值:[0 - 100]、[200 - 300]弦乐:专业人士、初学者等... 提前致谢。 最佳答案 有不同的方法可以做到这一点。最简单的一种
我正在开发一种工具来查找给定纬度和经度的两点之间的距离。当纬度和经度在 中给出时就可以了签名学位格式 .但是当在 中给出纬度和经度时,我找不到计算距离的方法。度分秒格式 (例如:N 11° 14' 5
编辑距离查找一个字符串到另一个字符串所需的插入、删除或替换次数。我还想在这个算法中包含掉期。例如“apple”和“appel”应该给出1的编辑距离。 最佳答案 您定义的编辑距离称为 Damerau-L
我实现了一个 levenshtein trie 来查找与给定单词相似的单词。 我的目标是有一种快速的方法来进行拼写纠正。 但是我发现有一种更快的方法可以做到这一点: 莱文斯坦自动机 我只是有一个问题.
我是一名优秀的程序员,十分优秀!