gpt4 book ai didi

java - 使用 lucene 保持查询统计

转载 作者:塔克拉玛干 更新时间:2023-11-03 03:56:21 26 4
gpt4 key购买 nike

我正在使用 Lucene 开发 Web 应用程序的搜索组件。我想将用户查询保存到索引中,并使用它们向用户建议备用查询,并保留查询统计信息(最常用的查询、得分最高的查询……)。

要将此数据用于备用查询建议,我会分析查询以查看哪些术语最常相互使用,并使用它来为用户创建建议。

但我想不出用哪种形式来索引数据。我正在考虑简单地将查询添加到索引中,但那样可能会有很多冗余数据,因为索引中的许多文档都具有相同的内容。有没有人对实现这一目标的方式有任何想法?

感谢您的帮助。

最佳答案

"I was thinking of simply adding the queries into the index, but in that way there could be a lot of redundant data since many documents in the index would have the same content"

您可以 tell Lucene 不存储文档内容,这意味着主要的开销将是唯一的 Terms 和索引本身。因此,将每个查询存储为一个唯一的文档可能不会产生很大的开销……这样您就不会丢弃任何信息。

关于java - 使用 lucene 保持查询统计,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4277962/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com