gpt4 book ai didi

fuzzy-search - 轻量级模糊搜索库

转载 作者:行者123 更新时间:2023-12-03 22:35:16 26 4
gpt4 key购买 nike

你能推荐一些轻量级的模糊文本搜索库吗?

我想要做的是允许用户为有拼写错误的搜索词找到正确的数据。

我可以使用像 Lucene 这样的全文搜索引擎,但我认为这是一种矫枉过正。

编辑:
为了使问题更清楚,这里是该库的主要场景:
我有一个很大的字符串列表。我希望能够在此列表中进行搜索(类似于 MSVS 的智能感知),但应该可以通过字符串过滤此列表,该字符串不存在但足够接近列表中的某个字符串。
例子:

  • 红色
  • 绿色
  • 蓝色

  • 当我在文本框中键入“Gren”或“Geen”时,我希望在结果集中看到“Green”。

    索引数据的主要语言将是英语。

    我认为 Lucene 对这项任务来说太重了。

    更新 :

    我找到了一款符合我要求的产品。它是 ShuffleText .
    你知道任何替代方案吗?

    最佳答案

    Lucene 具有很强的可扩展性——这意味着它也适用于小型应用程序。如果您只需要这些,您可以非常快速地在内存中创建索引。

    对于模糊搜索,您确实需要决定要使用的算法。对于信息检索,我使用 n-gram Lucene 技术成功。但那是一种特殊的索引技术,本身并不是一个“库”。

    如果不了解有关您的应用程序的更多信息,推荐合适的库并不容易。你在搜索多少数据?数据是什么格式?数据多久更新一次?

    关于fuzzy-search - 轻量级模糊搜索库,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41970/

    26 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com