gpt4 book ai didi

java - 将 Lucene 的 MoreLikeThis 限制为我文档的一个子集

转载 作者:行者123 更新时间:2023-11-29 09:08:34 25 4
gpt4 key购买 nike

我正在使用 Lucene 为我的网站内容编制索引并提供搜索工具。我还使用 Lucene 的 MoreLikeThis 为站点生成“相关页面”工具。我的网站是多语言的,因此我需要一次将 MoreLikeThis 限制为一种特定语言。

有人知道如何做到这一点吗?

最佳答案

MoreLikeThis返回一个查询对象。
MoreLikeThis mlt = new MoreLikeThis(ir);<br/>
Reader target = ... // orig source of doc you want to find similarities to<br/>
Query query = mlt.like( target);

您可以创建第二个查询来检查语言。然后使用您可以创建一个 BooleanQuery 来包装两个查询,如下所示:

BooleanQuery booleanQuery = new BooleanQuery();<br/>
booleanQuery.add(MoreLikeThisQuery, BooleanClause.Occur.MUST);<br/>
booleanQuery.add(languageQuery, BooleanClause.Occur.MUST);

性能效率不高,但如果你的语料库很小,它就能完成工作。

关于java - 将 Lucene 的 MoreLikeThis 限制为我文档的一个子集,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13549176/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com