gpt4 book ai didi

elasticsearch - 如何计算分数(别名字段的长度)

转载 作者:行者123 更新时间:2023-12-03 01:17:20 24 4
gpt4 key购买 nike

假设我们有一个人的文档,其中包含他们的姓名和别名数组,如下所示:

{
name: "Christian",
aliases: ["נוצרי", "کریستیان" ]
}

假设我有一个具有10个别名的文档,另一个具有2个别名的文档
但是它们两个都包含值为 کریستیان的别名。

第一个文档的 length of field (dl)比第二个文档大
因此第一个文档的 term frequency (tf)低于第二个文档。最终,别名较少的文档的分数会比另一个更大。

有时我想为使用不同语言和不同形式的人添加更多别名,因为他/她比较有名,但导致结果得分较低。我想以某种方式从查询的计算中删除 length of the aliases field

最佳答案

Norms
存储字段的相对长度。

How long is the field? The shorter the field, the higher the weight. If a term appears in a short field, such as a title field, it is more likely that the content of that field is about the term than if the same term appears in a much bigger body field.



可以使用PUT映射API禁用规范
PUT my_index/_mapping
{
"properties": {
"title": {
"type": "text",
"norms": false
}
}
}

进一步研究的链接
  • https://www.elastic.co/guide/en/elasticsearch/guide/current/scoring-theory.html#field-norm
  • 关于elasticsearch - 如何计算分数(别名字段的长度),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/61884606/

    24 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com