gpt4 book ai didi

java - 如何获取Lucene TopDocs中文档的唯一计数?

转载 作者:行者123 更新时间:2023-11-30 04:39:47 25 4
gpt4 key购买 nike

当我询问 TopDocs 对象上的属性“totalHits”时,我得到了点击数。但我想知道找到了“多少”文档,而不是“总点击数”。

示例:

- document 1: field A: foo bar - field B: testjes
- document 2: field A: bar foo - field B: foo bar

如果我搜索“foo”,当我请求“docs.totalHits”时,我将得到 3 个结果。但我想知道文档的数量,是2。

我可以循环列表并将“文档 ID”保存在集合中。然后问Set的大小,但是Lucene支持更好的方式来解决这个问题吗?

乔亨

最佳答案

据记录here您可以使用 getTotalHits()TopDocCollector 检索它。

编辑:例如

TopScoreDocCollector collector = TopScoreDocCollector.create(10, true);
searcher.search(query, collector);
TopDocs topDocs = collector.topDocs();
int numResults = collector.getTotalHits();

关于java - 如何获取Lucene TopDocs中文档的唯一计数?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12578791/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com