javascript - 自动提示最合适的数据结构是什么？-6ren

javascript - 自动提示最合适的数据结构是什么？

转载作者：搜寻专家更新时间：2023-10-31 23:04:58

24

4

我想实现一个自动提示组件。对于每个用户输入，组件应该提供零个或多个建议。

例如，如果用户输入 'park'，建议可以是:['Parkville', 'Parkwood', 'Bell Park']。

要求很简单:

它应该不区分大小写(用户应该得到与 'park'、'PARK' 和 'PaRk' 相同的建议)
它应该匹配每个单词的开头('pa' 将匹配 'Parkville'、'Bell Park' 和 '非常酷的公园'，但不是 'Carpark')

您会选择哪种数据结构在 Javascript 中实现它？

是否有任何 Javascript/Node.js 库可以提供帮助？

最佳答案

我认为此类任务的最佳数据结构是 trie .关于不区分大小写 - 在添加到 trie 之前将每个单词小写并对小写单词执行搜索。

当您到达 trie 的某个点时，有一些子 Node 是满足字符串 - 具有从根到当前点的前缀的字符串。

输出建议 - 从当前点(从根到达用户输入的前缀)递归地 walk 并在标记为叶子的 Node 上打印建议。在 ~10 个输出后停止打印，因为 trie 可能有很多令人满意的单词。

这是 js 实现:trie-js , trie和许多其他人。搜索js+trie就可以了。可能trie+autosuggest+js也行)

更新 1

如果要输出O(1)中的所有变体(当然，每个建议的 O(1))，如果没有递归遍历，您可以在每个 Node 中存储引用数组列表。 Arraylist存储属于 Node 的所有单词的索引，每个值都是其他字典araylist中的索引。

类似的东西:

向字典添加单词:

签到 O(word_len)它在一个 trie 中(已经添加)。如果没有，添加到字典并记住“存储”中的索引

 if(!inTrie(word)){
    dict.push(word);
    index = dict.length-1; //zero based indices
    // now adding to trie
    for each node visited while addition to trie : node.references.push(index)
 }

搜索:

Go to node with prefix==typed word;
for(int i=0;i<min(curNode.references.length(),10);i++)
print(dict[curNode.references[i]];

更新 2

关于'pa' --> '非常酷的公园'

您肯定应该将短语拆分为单独的单词，以便每个单词在 trie 中“可搜索”。但!当您将短语视为一个词时，您应该将它存储在一个单元格中。

我的意思是:

String phrase = "Very cool parl";
dict.push(phrase);
index = dict.length-1;

parts[] = split(phrase);
for part in parts{
 add part - for each node visited while addition of part perform node.references.push(index);
}

换句话说，短语的代码与单个单词的代码相同。和引用是一样的，因为我们将所有部分一起存储在一个单元格中作为一个短语。区别在于按部分拆分和添加pharse。很简单，你看。

更新 3

顺便说一句，引用存储在内存消耗方面并不那么“昂贵”——单词中的每个字母都是 trie 中的某个 Node ，这意味着某个数组列表中有 1 个条目(该单词在全局存储数组中的一个整数索引)。所以，你只需要额外的 O(dictionary_length) 内存，即 ~ 50000*20 = 1 000 000 个整数 ~ 4 MB，假设每个单词最多有 20 个字母。因此，所需内存的上限为 4 MB。

更新 4

关于'e e' --> 东鹰。

好的，在发布任何想法之前，我想警告说这是非常奇怪的自动建议行为，自动建议通常匹配一个前缀而不是所有前缀。

有一个非常简单的想法，它会增加搜索复杂度，这样多个前缀并行搜索对于一些增量，其中增量复杂度 = 查找集交集的复杂度。

现在全局存储不仅包含索引，还包含对 <a,b> where a = index in storage, b = index in pharse.对于简单的单词 b=0 或 -1 或任何特殊值。
现在每个 trie Node 引用数组列表都包含对。当用户输入前缀短语时，例如“ea ri”，您应该像往常一样找到“ea” Node ，遍历引用但只考虑那些条目，其中a=any, b =1，因为输入短语中的 ea 索引 = 1。将所有这些 a指数，其中 b=1到一些集合。查找 ri Node 像往常一样，遍历引用并把那些 a其他集合的索引 b=2等等。查找索引集的交集。按索引输出存储词，其中索引属于集合的交集。

当您搜索的不是短语而是简单的词时，您会遍历所有引用项。

关于javascript - 自动提示最合适的数据结构是什么？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/29966149/

24

4

0

文章推荐： jquery - 使用 jQuery 默认选中一个复选框？

文章推荐： javascript - 如何更改 DataBound 事件中的网格列值

文章推荐： node.js - 如何在 NPM 版本中表示内部版本号？

ios - 什么时候使用presentedViewController 合适？
假设我正在使用 segues 转换 View Controller 。我在 View Controller 1 上有一个 textField，在第二个 View Controller 上有一个标签。当
sql - 为什么我们在进行事务时需要回滚命令或告诉我什么时候使用 "ROLLBACK"合适
在下面的代码中，当我在表中插入数据时，回滚的目的是什么，如果我想回滚，我不应该插入它，那么使用回滚的合适方法是什么？ BEGIN TRANSACTION Insert into dimCustomr
scala - 什么时候使用 TrieMap 合适？
我一直在阅读一些帖子，并想知道是否有人可以介绍 TrieMap 何时比使用 HashMap 更可取的情况。那么本质上是什么架构决策应该激励使用 TrieMap？最佳答案根据文档。它是可以在多线
language-agnostic - 什么时候使用 do-while 合适？
什么时候 do-while 比其他类型的循环更好？有哪些常见场景比其他场景更好？我了解 do-while 的功能，但不了解何时使用它。最佳答案当您需要至少完成一次某事，但不知道启动循环之前的次数
cocoa - 什么时候调用 fileExistsAtPath 合适？
fileExistsAtPath 的文档如下: Attempting to predicate behavior based on the current state of the file syst
ios - 什么时候发布 CGImageRef 合适？
当 XCode 分析我的代码时，它发现了潜在的内存泄漏。我使用 ARC，但我了解到 ARC 不处理 C 类型。因为我使用 CGImageRef 来创建 UIImage 并分配给 UIImageView
c# - 什么时候使用 CacheItemRemovedCallback 合适？
我有一个每天更新一次的大型数据集。我正在缓存对该数据进行昂贵查询的结果，但我想每天更新该缓存。我正在考虑使用 CacheItemRemovedCallback 每天重新加载我的缓存，但我有以下问题:
inversion-of-control - 什么时候使用 IoC 合适？
我了解 IoC 容器是什么，并且一直在阅读结构图。该技术似乎很容易使用。我的问题是，使用 IoC 容器的适当粒度级别是多少？我看到以下可能的 IoC 应用级别: 打破所有对象之间的所有依赖关系——当
Java:存储数据库中的信息。哪些 Collection 合适？
我用 Java 编写了一个应用程序。我从数据库中获取一个表(客户端)，其中包含以下字段: 名称 |姓氏 |地址在我的应用中存储这些数据的最佳解决方案是什么？我应该为每个客户端创建一个对象并将这些对象
javascript - 什么时候用 this 代替 prototype 合适？
这个问题在这里已经有了答案: Use of 'prototype' vs. 'this' in JavaScript? (16 个答案) 关闭 8 年前。 function A() { this
python - 什么时候调用 loop.close() 合适？
我已经试验了一段时间 asyncio 并阅读了 PEPs ；一些教程；甚至是 O'Reilly book 。我想我已经掌握了窍门，但我仍然对 loop.close() 的行为感到困惑，我不太清楚何时
c++ - 使用 DialogBox 作为主窗口是否正确/合适？
它是否正确，因为在 Windows 中并没有说它不好或不推荐。例如像这样: int APIENTRY _tWinMain(HINSTANCE hInstance,
.htaccess 重定向 - 更新站点(301 合适？)
我在更新我的网站时遇到问题，谷歌搜索结果显示指向旧页面的链接，这些链接现在是 404，其中一些甚至包含已弃用的内容。我的问题是关于 301 的使用。旧页面具有深层嵌套页面，如下例所示: ww
java - 什么时候调用 robot.cleanUp() 合适
我使用 JUnit 和 FEST 对我们的应用程序进行 Swing 集成测试，我在测试用例中多次启动和停止。 @after 是否应该包含对 robot.cleanUp() 的调用？最佳答案一般规则
c# - 什么时候使用 C# 类库 (.dll) 合适？
我是一名从未真正使用过 .dll 文件的程序员。当然，当我需要第 3 方软件时，例如图形库、帮助我创建图形的库等。我会将引用/ddl 文件添加到我的程序中并在我的代码中使用它们。此外，您似乎可以将
networking - 什么时候使用 UDP 而不是 TCP 合适？
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。这个问题似乎不是关于 a specific programming problem, a softwar
kotlin - 如何使 "inappropriate blocking method call"合适？
我目前正在尝试更多地利用 kotlin 协程。但我面临一个问题:在这些协程中使用 moshi 或 okhttp 时，我收到警告: “不适当的阻塞方法调用” 解决这些问题的最佳方法是什么？我真的不想不合
asp.net-mvc - 什么时候使用 Html.RenderAction() 合适？
我有点不确定什么时候适合使用 Html.RenderAction() 来渲染我的 View ，什么时候不适合。我的理解是，因为它不是 ASP.NET MVC 的“官方”组件，所以使用它是不好的做法，它
asp.net-mvc - 什么时候使用 ViewData 而不是 ViewModels 合适？
假设你想开发你的 Controller ，以便你使用 ViewModel 来包含你渲染的 View 的数据，所有数据都应该包含在 ViewModel 中吗？什么条件下可以绕过 ViewModel？我
.net - 什么时候说 : "Now I need to create a user control!" 合适
您何时考虑在 .NET 中创建用户控件？您是否有一些基本标准来从页面中排除您的代码并引入新的用户控件？通常我倾向于遵循这些来决定我是否需要用户控件: 当使用单独的用户控件使页面看起来更具可读性时当

首页

博学

6Ren·AI

商城

javascript - 自动提示最合适的数据结构是什么？