gpt4 book ai didi

搜索词建议

转载 作者:行者123 更新时间:2023-12-02 06:33:37 25 4
gpt4 key购买 nike

这个问题以前已经以各种方式提出过,但我想知道有自动搜索词建议经验的人是否可以提供有关最有用和最有效的方法的建议。场景如下:

我刚刚开始建立一个网站,该书是一本术语词典(大约 1,000 个条目,平均有 300 个单词的解释),其中许多内容相当晦涩,并且该网站的许多访问者可能不知道如何拼写这些单词。出版商希望为每个条目提供全文搜索。所以,我希望实现一个具有拼写纠正功能的搜索引擎。主站点可能会在带有 MySQL 数据库的 PHP 框架(或可能是 Django)中完成。

在这方面有经验的人可以就以下问题提供建议吗:

  • 有了这种性质的集合语料库,我应该使用类似 Lucene 的东西吗?或Sphinx对于搜索引擎?
  • 据我所知,这两个都没有内置的建议功能。所以看来我需要整合以下一项或多项。有哪些优点/缺点:

我担心我的语料库的特殊性,并且不希望 Google 开始建议与本书无关的内容。我也不确定是否应该尝试使用变音位比较和编辑比较,或者其他一些技术组合来捕获拼写错误和语音拼写尝试。

最佳答案

您可能需要考虑Apache Solr ,它是Lucene的Web服务封装,运行在Tomcat等J2EE容器中。您将获得术语建议、拼写检查、移植、词干提取等。真的非常非常好。

参见here其与查询相关的功能的完整列表。

DjangoPHP Solr 库。

无论如何,我不建议对这样一个专门的语料库使用 Google Suggest,并且使用 Solr,您将不需要它。

希望这有帮助。

关于搜索词建议,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3571021/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com