gpt4 book ai didi

java - Elastic Java Boost 日期

转载 作者:行者123 更新时间:2023-11-30 03:20:09 24 4
gpt4 key购买 nike

我希望跟进 this根据日期提升结果的问题。然而,在这个问题中,衰减函数似乎优先于实际搜索内容。

QueryBuilder qb = QueryBuilders.multiMatchQuery(term,"title", "description","url").field("title", 1.75f).field("url", 1.55f).field("description", 1.35f);
FunctionScoreQueryBuilder builder = QueryBuilders.functionScoreQuery(qb);
builder.add(ScoreFunctionBuilders.exponentialDecayFunction("postDate","14d"));

例如,如果我使用上述构建器在我的索引中搜索有关 Mario Draghi 的推文,如果过去 14 天内有较新的推文提到“Mario Draghi”,那么它们首先出现,然后是过去 14 天内提到的推文任何其他与“Mario”匹配的内容(而不是显示旧的“Mario Draghi”推文)。

我想要做的基本上是增强文档,如果其日期字段“postDate”是新的(比方说 14 天),但我不希望日期优先于搜索的准确性。我更喜欢旧的“马里奥·德拉吉”推文而不是“ super 马里奥兄弟”推文。换句话说,我的索引中有数千条推文提到 Mario Draghi - 但在上面的代码中,我仅在 14 天内收到它们。

有人可以指出我更准确的完成方法吗?我在这个post中看到提升幅度在一定范围内。这对我来说很有意义——但我想知道这是否是实现目标的首选方式?我希望有一种更优雅的方式?

最佳答案

在许多情况下,期望的结果是保留您的相关性分数,并为最近的匹配项提供额外的提升(更高的分数),因为数据更新鲜。为了实现这一点,您可以使用 Elasticsearch 的评分功能。 Webpage Source .

final MultiMatchQueryBuilder multiMatchQuery = QueryBuilders.multiMatchQuery("Bababooey", "title^0.8", "url^0.6", "description^0.3").type(MultiMatchQueryBuilder.Type.BEST_FIELDS);

final FunctionScoreQueryBuilder functionScoreQuery = QueryBuilders.functionScoreQuery(multiMatchQuery);
functionScoreQuery.scoreMode("multiply");
functionScoreQuery.boostMode(CombineFunction.MULT);
functionScoreQuery.add(ScoreFunctionBuilders.gaussDecayFunction("postDate","130w").setOffset("26w").setDecay(0.3));

这个例子增强了过去半年发布的所有文档。超过六个月的文件得分将逐渐降低,直到达到两年半的阈值。超过两年半的文档不会根据新近度获得任何额外评分。通过更改 setOffet 和 setDecay 可以轻松地将其转移到两周或任何可能的提升窗口...

关于java - Elastic Java Boost 日期,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31521249/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com