- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在使用字符串编辑距离 (Levenshtein-distance) 来比较眼动追踪实验的扫描路径。 (现在我在 R 中使用 stringdist
包)
基本上,字符串中的字母指的是 6x4 矩阵中的(注视)位置。矩阵配置如下:
[,1] [,2] [,3] [,4]
[1,] 'a' 'g' 'm' 's'
[2,] 'b' 'h' 'n' 't'
[3,] 'c' 'i' 'o' 'u'
[4,] 'd' 'j' 'p' 'v'
[5,] 'e' 'k' 'q' 'w'
[6,] 'f' 'l' 'r' 'x'
如果我使用基本的 Levenshtein 距离来比较字符串,a
的比较和 g
在字符串中给出与 a
的比较器相同的估计值和 x
.
例如:
'abc' compared to 'agc' -> 1
'abc' compared to 'axc' -> 1
这意味着字符串是等(不)相似
我希望能够以一种在矩阵中包含邻接关系的方式对字符串比较进行加权。例如。 a
之间的距离和 x
应该比 a
之间的权重更大和 g
.
一种方法是计算矩阵中一个字母到另一个字母的“步行”(水平和垂直步长),然后除以最大“步行”距离(即从 a
到 x
)。例如。 “步行”距离a
至 g
将是 1 并且来自 a
至 x
它将是 8,导致权重分别为 1/8 和 1。
有没有办法实现这个(在 R 或 python 中)?
最佳答案
您需要一个版本的 Wagner-Fisher algorithm在其内部循环中使用非单位成本。 IE。其中通常的算法有+1
,使用+del_cost(a[i])
等,定义del_cost
,ins_cost
和 sub_cost
作为采用一个或两个符号的函数(可能只是表查找)。
关于python - 具有权重/邻接惩罚的编辑距离,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23515895/
我在 ma 应用程序中使用 Jqgrid 树 View 模型,我可以看到它显示错误,因为不支持对象或属性我已经包含了 grid.Treeview.js 和其他 Jqgrid 脚本文件。我不知道可能是什
我正在尝试使用图中所示的符号在 matlab 上实现 Freeman Chain Code [4 adjacency]: 我的代码为我测试过的多个小矩阵提供了正确的链码。但是,当我在我的实际图像文件上
我有一张表,其中包含世界上所有地理位置及其关系的位置。 这是一个显示层次结构的示例。你会看到数据实际上存储为所有三个 枚举路径 邻接表 嵌套集 数据显然也不会改变。下面是英格兰布莱顿位置的直系祖先示例
我正在尝试从邻接树模型(id、parent_id)中的 MySQL 数据库中计算/创建或生成 PHP 目录。到目前为止,这是我在回显输出时所取得的成就。 1. Category 1 1 Subc
我知道 std::vector在内部连续存储它的数据(除非它是 std::vector )都在旧的 C++03 中标准和新的C++11 . 处理此问题并引用标准的好 stackoverflow 问题:
Development language and DB: PHP/MySQL 我有一张 geo_places 表,其中包含大约 800 万个地理位置。 这些地方都是分层次的,我用 parent_id
过去几个小时我一直在尝试在网上找到这个问题的解决方案。我找到了很多关于如何从嵌套集合转换为邻接的例子......但很少有相反的例子。我发现的示例要么不起作用,要么使用 MySQL 过程。不幸的是,我不
我是一名优秀的程序员,十分优秀!