Clojure:尾递归以获取 trie 的叶子计数

转载作者：行者123 更新时间：2023-12-02 21:14:43

24

4

我有一个使用 HashMap 的特里数据结构。我想计算它的叶子，但我的尾递归太慢:我认为我使用了错误的数据结构。请帮忙。

我认为(vec trie)部分很愚蠢，请纠正我!

特里结构定义

(defn add-to-trie [trie x]
  (assoc-in trie x (merge (get-in trie x) {:terminal true})))

所以字典树会是这样的:

(def trie 
  (reduce add-to-trie {} (map #(re-seq #"\S" (.trim %1)) ["x" "y" "abt" "act"])))

{"a" {"c" {"t" {:terminal true}}, 
      "b" {"t" {:terminal true}}},
 "y" {:terminal true},
 "x" {:terminal true}}

递归版本

我解决了一个递归问题:

(defn terminal-count [root] 
  (if (:terminal root) 
    (+ 1 (terminal-count (dissoc root :terminal)))
    (apply + (map terminal-count (vals root)))))

丑陋的尾递归

(defn terminal-count2 [trie] 
  (loop [cnt 0 nodes (vec trie)] 
    (cond 
      (empty? nodes) cnt 
      :else          (let [des (val (last nodes))]
                       (cond 
                         (map? des) (recur cnt (vec (concat (pop nodes) des)))
                         :else      (recur (inc cnt) (pop nodes)))))))

我发现在 13 万个 8~16 个字符串上，第二个比第一个慢 30 倍。我必须使用错误的数据结构(我认为将 trie 转换为 vec 很难看)或者做了愚蠢的事情。

PS。使用向量作为队列是不好的做法，这是我问题的关键点吗？

最佳答案

事实上，我们可以假设持久数据结构不能为这种计算提供最佳性能。

我可以建议改用 transients ，简而言之，它们是 Clojure 集合的可变实现。这将导致如下结果:

(defn terminal-count-transient [trie] 
  (loop [cnt 0,nodes (transient (vec trie))] 
    (cond (t-empty? nodes) cnt 
          :else (let [des (val (t-last nodes))
                      remaining-nodes (pop! nodes)] 
                  (cond 
                    (map? des) (recur cnt, (reduce conj! remaining-nodes des)) 
                    :else (recur (inc cnt) remaining-nodes))))))

我为 transient 向量定义了 2 个辅助函数 t-last 和 t-empty?(并非 Clojure 集合的所有读取接口(interface)都已扩展到 transient 尚未):

(defn t-empty? [t-vec]
  (= (count t-vec) 0))

(defn t-last [t-vec]
  (t-vec (dec (count t-vec))))

我不能假装这是最佳的，但在我的机器上，它的性能比您上面定义的递归版本好两倍。

我能想到的其他选择是:

利用懒惰。 (根据我的尝试，您可以轻松地得到比递归版本“仅”慢两倍的东西)。例如，您可以定义一个返回叶子的惰性序列的函数，然后对其进行计数。
使用常规的可变 Java 队列，例如 java.util.ArrayDeque。使用起来可能比较重，但速度相当快。

关于Clojure:尾递归以获取 trie 的叶子计数，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/25221646/

24

4

0

文章推荐： haskell - 如何使用 Haskell pretty-print 分层缩进 "nest"

文章推荐： docker - 如何查看kubernetes的入口端点？

文章推荐： laravel - 使用 laravel Blade 嵌套 View

c# - 拼字游戏查找器 : building a trie, 存储一个 trie，使用一个 trie？
我正在尝试做的事情: 构建一个移动网络应用程序，用户可以在玩拼字游戏时获得帮助找到要玩的单词用户通过输入任意数量的字母和 0 个或多个通配符来获得单词建议我是如何尝试做到这一点的: 使用 MySQ
string - 将 trie 转换为反向 trie？
假设我有一个 trie 包含多个字符串的数据结构。要在 trie 中查找字符串，我会从根开始，然后按顺序跟随标有字符串适当字符的指针，直到到达给定节点。现在假设我想为同一组字符串构建一个“反向 tr
Solr 数值 Trie 与传统 trie(前缀树)
我正在阅读 Ingersoll、Morton 和 Farris 撰写的 Taming Text，但我不明白 solr 的数字 trie 实现如何帮助搜索文本？我对 solr.TrieField fie
Solr Numerical Trie 与传统的 trie(前缀树)
我正在阅读 Ingersoll、Morton 和 Farris 的 Taming Text，但我不明白 solr 的数字 trie 实现如何帮助搜索文本？我对 solr 的 solr.TrieFiel
algorithm - Trie 实现 - 将元素插入到 trie 中
我正在开发一个 Trie 数据结构，其中每个节点代表一个词。所以词 st, stack, stackoverflow 和 overflow 将被排列为 root --st ---stack -----
algorithm - trie 和 radix trie 数据结构有什么区别？
trie 和radix trie 数据结构是一回事吗？如果它们不相同，那么 radix trie (AKA Patricia trie) 是什么意思？最佳答案基数树是 trie 的压缩版本。在
c++ - 在 C++ 中构建前缀 Trie，后缀 Trie
我用过 video理解前缀特里树(虽然最终我试图最终得到后缀特里树)但是示例代码的链接被破坏所以我从视频中想出了这个，有两个功能，即插入和搜索如下 void insert(string word)
208. Implement Trie (Prefix Tree) 实现 Trie (前缀树)
本文关键词：Leetcode, 力扣，Trie, 前缀树，字典树，208，Python, C++, Java 题目地址：https://leetcode.com/problems/implement
c - 使用 trie.c 和 trie.h 打印 string-tri
这是我使用 trie.c 和 trie.h 制作的主文件。该程序的目的是存储字典文件中的单词。 node* x = (node*)malloc(sizeof(node)); x = insert("b
trie - 搜索丢失字母的算法
因此，我必须搜索缺少字母(用于填字游戏)的单词，并且还必须维护剩余空格的可能单词列表。现在我的问题是，我已经用谷歌搜索了 burst-trie 是否是最快的搜索算法。但是，如果我在 trie 中编写
Ocaml TRIE 实现
我正在尝试将这个 trie 实现用于 ocaml:http://www.lri.fr/~filliatr/ftp/ocaml/ds/trie.ml.html 这是我对模块“M”的实现: module
c++ - trie 数据结构中的所有单词
我试图将 trie 中的所有单词放入字符串中，单词由 eow 字段表示，对于 trie 数据结构中的某个字符为 true，因此 trie 可以有字母但没有单词，例如“abc”在 trie 中，但“c”
string - 字符串匹配中的前缀与后缀 Trie
我不太了解尝试字符串匹配中使用的实际算法。我想知道为什么似乎更关注字符串匹配的后缀尝试而不是前缀尝试。我们可以不使用前缀尝试来进行子字符串匹配吗？换句话说，后缀尝试相对于前缀尝试有什么优势？最佳答
javascript - Trie 在分支末尾存储字符串超出了调用堆栈限制
当你构建一个特里树时，你是否将字符串/句子存储在其分支的末尾，以便在分支的末尾轻松访问它？有些人这样做，我有时也这样做，但我应该这样做吗？有时(尤其是使用 LeetCode)，我会收到此错误: Li
Clojure:如何生成 'trie' ？
鉴于以下情况... (def inTree '((1 2) (1 2 3) (1 2 4 5 9) (1 2 4 10 15) (1 2 4 20 25))) 你如何将它转换
java - 这是什么类型的 Trie？
我想为高棉语(一种单词之间没有空格的语言)添加一个开源 Java 单词分割程序。开发人员已经很长时间没有开发它了，我无法联系他们了解详细信息(http://sourceforge.net/projec
检查 trie 数据结构中的撇号
我有一个字典文件(仅包含小写字母和撇号的单词)，它作为特里树加载。我有一个检查函数，它检查文件中的单词是否存在于特里树中树，无论字母大小写。一切正常，除了撇号的单词总是拼写错误。这是我的函数 b
Java Trie 优化
我一直在练习 trie 数据结构(与类(class)作业无关)。此类用于存储字符串的子字符串。对于长度为 n 的字符串，总共有 n(n+1)/2 个子字符串。特别是 trie 的这种实现保留了自然顺序
C++ Trie 搜索性能
所以我创建了一个包含大量数据的 trie，我的搜索算法非常快，但我想看看是否有人知道我如何才能让它更快。 bool search (string word) { int wordLen
c++ - Trie 实现运行时错误
我正在尝试用 C++ 实现 Trie，但出现运行时错误... 这是我的代码: #include using namespace std; struct trie{ bool word = f

首页

博学

6Ren·AI

商城

Clojure:尾递归以获取 trie 的叶子计数

特里结构定义

递归版本

丑陋的尾递归