- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
“canonize”函数(下面给出,来自 Ukkonen 的论文)是如何工作的,特别是 while 循环何时结束?我认为 p' - k' 的值将始终小于 p - k 的值。我是对还是错?
procedure canonize(s, (k, p)):
1. if p < k then return (s, k)
2. else
3. find the tk–transition g'(s, (k', p')) = s' from s;
4. while p' − k' <= p − k do
5. k = k + p' − k' + 1;
6. s = s';
7. if k <= p then find the tk–transition g'(s, (k', p')) = s' from s;
8. return (s, k).
最佳答案
什么 canonize
函数的作用是在 this SA post 的最后描述的,我们考虑这样的情况:
情况是这样的:
活跃点在(red,'d',3)
,即 defg
中的三个字符边从红色节点出去。
现在我们跟随绿色节点的后缀链接。理论上,我们的事件节点现在是(green,'d',3)
.
不幸的是,那个点不存在,因为 de
从绿色节点出来的边只有 2 个字符。 因此,我们应用 canonize
功能。
它的工作原理是这样的:
我们感兴趣的边的起始字符是d
.此字符在 Ukkonen 的表示法中称为 tk。因此,“找到 tk-edge”意味着找到 de
绿色节点处的边。
这条边的长度只有两个字符。 IE。 (p' - k') == 2
在 Ukkonen 的符号中。但原来的边缘有三个字符:(p - k) == 3
.所以<=
为真,我们进入循环。
我们从 def
缩短我们正在寻找的边至 f
.这就是p := p + (k' - p') + 1
步骤确实如此。
我们前进到状态 de
边缘指向,即蓝色状态。那就是s := s'
会。
自剩余部分f
的边不为空(k <= p
),我们识别相关的出边(即fg
出蓝色节点的边)。此步骤将 k' 和 p' 设置为全新的值,因为它们现在引用字符串 fg
,它的长度 (p' - k') 现在将为 2。
剩余边的长度f
, (p - k), 现在为1,候选边的长度fg
对于新的事件点,(p' - k') 是 2。因此循环条件
同时 (p' - k') <= (p - k) 做
不再为真,因此循环结束,新的(正确的)事件点确实是 (blue,'f',1)
.
[实际上,在 Ukkonen 的表示法中,一条边的结束指针 p 指向该边的最后一个字符的位置,而不是它后面的位置。因此,严格来说,(p - k)是0,不是1,(p' - k')是1,不是2。但重要的不是长度的绝对值,而是两者不同的相对比较长度。]
一些最后的说明:
像 p 和 k 这样的指针指的是原始输入文本 t 中的位置。这可能非常令人困惑。例如,de
中使用的指针绿色节点处的边将引用一些 子串de
t 的指针,以及 fg
中使用的指针蓝色节点处的边将引用一些 子串fg
吨。尽管字符串 defg
必须作为一个连续的字符串出现在 t 中的某处,子字符串 fg
也可能出现在其他地方。所以,fg
的指针 k edge 不一定 de
的结束指针 p边加一。
因此,当我们决定是否结束循环时,重要的不是绝对位置 k 或 p,而是剩余边的长度 (p - k) 与长度 (p' - k' ) 当前候选边。
在你的问题中,代码片段的第 4 行,有一个错字:它应该是 k'
而不是 k;
.
关于string - Ukkonen 后缀树 : procedure 'canonize' unclear,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10097323/
关于 B 树与 B+ 树,网上有一个比较经典的问题:为什么 MongoDb 使用 B 树,而 MySQL 索引使用 B+ 树? 但实际上 MongoDb 真的用的是 B 树吗?
如何将 R* Tree 实现为持久(基于磁盘)树?保存 R* 树索引或保存叶值的文件的体系结构是什么? 注意:此外,如何在这种持久性 R* 树中执行插入、更新和删除操作? 注意事项二:我已经实现了一个
目前,我正在努力用 Java 表示我用 SML 编写的 AST 树,这样我就可以随时用 Java 遍历它。 我想知道是否应该在 Java 中创建一个 Node 类,其中包含我想要表示的数据,以及一个数
我之前用过这个库http://www.cs.umd.edu/~mount/ANN/ .但是,它们不提供范围查询实现。我猜是否有一个 C++ 范围查询实现(圆形或矩形),用于查询二维数据。 谢谢。 最佳
在进一步分析为什么MySQL数据库索引选择使用B+树之前,我相信很多小伙伴对数据结构中的树还是有些许模糊的,因此我们由浅入深一步步探讨树的演进过程,在一步步引出B树以及为什么MySQL数据库索引选择
书接上回,今天和大家一起动手来自己实现树。 相信通过前面的章节学习,大家已经明白树是什么了,今天我们主要针对二叉树,分别使用顺序存储和链式存储来实现树。 01、数组实现 我们在上一节中说过,
书节上回,我们接着聊二叉树,N叉树,以及树的存储。 01、满二叉树 如果一个二叉树,除最后一层节点外,每一层的节点数都达到最大值,即每个节点都有两个子节点,同时所有叶子节点都在最后一层,则这个
树是一种非线性数据结构,是以分支关系定义的层次结构,因此形态上和自然界中的倒挂的树很像,而数据结构中树根向上树叶向下。 什么是树? 01、定义 树是由n(n>=0)个元素节点组成的
操作系统的那棵“树” 今天从一颗 开始,我们看看如何从小树苗长成一颗苍天大树。 运转CPU CPU运转起来很简单,就是不断的从内存取值执行。 CPU没有好好运转 IO是个耗费时间的活,如果CPU在取值
我想为海洋生物学类(class)制作一个简单的系统发育树作为教育示例。我有一个具有分类等级的物种列表: Group <- c("Benthos","Benthos","Benthos","Be
我从这段代码中删除节点时遇到问题,如果我插入数字 12 并尝试删除它,它不会删除它,我尝试调试,似乎当它尝试删除时,它出错了树的。但是,如果我尝试删除它已经插入主节点的节点,它将删除它,或者我插入数字
B+ 树的叶节点链接在一起。将 B+ 树的指针结构视为有向图,它不是循环的。但是忽略指针的方向并将其视为链接在一起的无向叶节点会在图中创建循环。 在 Haskell 中,如何将叶子构造为父内部节点的子
我在 GWT 中使用树控件。我有一个自定义小部件,我将其添加为 TreeItem: Tree testTree = new Tree(); testTree.addItem(myWidget); 我想
它有点像混合树/链表结构。这是我定义结构的方式 struct node { nodeP sibling; nodeP child; nodeP parent; char
我编写了使用队列遍历树的代码,但是下面的出队函数生成错误,head = p->next 是否有问题?我不明白为什么这部分是错误的。 void Levelorder(void) { node *tmp,
例如,我想解析以下数组: var array1 = ["a.b.c.d", "a.e.f.g", "a.h", "a.i.j", "a.b.k"] 进入: var json1 = { "nod
问题 -> 给定一棵二叉树和一个和,确定该树是否具有从根到叶的路径,使得沿路径的所有值相加等于给定的和。 我的解决方案 -> public class Solution { public bo
我有一个创建 java 树的任务,它包含三列:运动名称、运动类别中的运动计数和上次更新。类似的东西显示在下面的图像上: 如您所见,有 4 种运动:水上运动、球类运动、跳伞运动和舞蹈运动。当我展开 sk
我想在 H2 数据库中实现 B+ Tree,但我想知道,B+ Tree 功能在 H2 数据库中可用吗? 最佳答案 H2 已经使用了 B+ 树(PageBtree 类)。 关于mysql - H2数据库
假设我们有 5 个字符串数组: String[] array1 = {"hello", "i", "cat"}; String[] array2 = {"hello", "i", "am"}; Str
我是一名优秀的程序员,十分优秀!