elasticsearch - Elasticsearch得分从0到1，用于搜索与现有文档相似的文档-6ren

elasticsearch - Elasticsearch得分从0到1，用于搜索与现有文档相似的文档

转载作者：行者123 更新时间：2023-12-02 22:34:19

25

4

搜索与现有文档相似的文档时是否需要从0到1计算相对得分？
因此，现有文档的得分为1，所有其他匹配文档的得分应根据该得分计算，且得分<=1。但是现有文档应从搜索中排除。是否有可能在Elasticsearch方面做到这一点，而不仅仅是使用像这样的编程语言手动计算得分:

match_doc_score/search_doc_score

假设我们有带有映射的索引 person:

{
  "properties": {
    "person_id": {
      "type": "keyword"
    },
    "fullname": {
      "type": "text"
    },
    "email": {
      "type": "keyword"
    },
    "phone": {
      "type": "keyword"
    },
    "country_of_birth": {
      "type": "keyword"
    }
  }
}

我的索引中有3个人:
人物1:

{
  "person_id": 1,
  "fullname": "John Snow",
  "email": "john@gmail.com",
  "phone": "111-11-11",
  "country_of_birth": "Denmark"
}

人物2:

{
  "person_id": 2,
  "fullname": "Snow John",
  "email": "john@gmail.com",
  "phone": "222-22-22",
  "country_of_birth": "Denmark"
}

人3:

{
  "person_id": 3,
  "fullname": "Peter Wislow",
  "email": "peter@gmail.com",
  "phone": "111-11-11",
  "country_of_birth": "Denmark"
}

通过此查询，我们找到与“人1”相似的人:

{
    "query": {
        "bool": {
            "should": [
                {
                    "match": {
                        "fullname": {
                            "query": "John Snow",
                            "boost": 6
                        }
                    }
                },
                {
                    "term": {
                        "email": {
                            "value": "john@gmail.com",
                            "boost": 5
                        }
                    }
                },
                {
                    "term": {
                        "phone": {
                            "value": "111-11-11",
                            "boost": 4
                        }
                    }
                },
                {
                    "term": {
                        "country_of_birth": {
                            "value": "Denmark",
                            "boost": 2
                        }
                    }
                }
            ],
            "must_not": [
                {
                    "term": {
                        "person_id": 123
                    }
                }
            ]
        }
    }
}

如你看到的:

人1和人2匹配:全名，电子邮件，出生国家。

人1和人3匹配者:电话，出生国家。

如果我们在索引(人1)中具有完全匹配的订单，是否可以得分为0..1？
我知道有一个 more_like_this查询，但是在现实生活中，搜索查询可能很复杂，因此 more_like_this不是一个好的选择。甚至elasticsearch文档都说，如果您需要对查询的更多控制，请使用 bool(boolean) 查询组合。

最佳答案

尚未尝试过但是功能评分的field value factor可能会解决您的查询。

关于elasticsearch - Elasticsearch得分从0到1，用于搜索与现有文档相似的文档，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/63931773/

25

4

0

文章推荐： arrays - elasticsearch将数据转换为数组

文章推荐： .net - PowerShell - 检查 .NET 类是否存在

文章推荐： python - 在 Elasticsearch 中的某些字段上禁用搜索

javascript 正则表达式得分
学生分数的正则表达式是什么:12.5, 99.5, 87, 1.66 该字段可以为空 (.) 的最大字符长度为 5，如下所示:99.99 分数介于 0 到 100 之间我用过这个，但是不起作用 va
mysql - 得分+当前玩家得分排名前10的玩家
对于服务器游戏...我有表珠宝: rank,player_id, plscore. 我想显示按分数从高到低排序的前 10 名玩家，如果当前玩家不在前 10 名，则加上当前玩家的分数。如果我/你目前不
ios - 得分+10时随机颜色
我的游戏中颜色很少: class GameScene: SKScene { let colors = [SKColor.green, SKColor.red, SKColor.blue, SKColo
javascript - 多项选择测验 - 得分？
我正在尝试用 HTML 创建一个简单的多项选择程序，但我在获取用户输入并在最后显示他们的分数时遇到了问题。有人可以帮帮我吗？我的多项选择测验有 10 个问题，每个问题有 4 个选择。例如有一个问题
Foursquare field 得分/评级
有谁知道如何使用 Foursquare API 获取 field 的分数/评级(例如 9.0/10)？我正在通过无用户访问进行连接。 https://developer.foursquare.com
c# - Jaccard 得分/距离或重叠百分比
我希望能够计算一个矩形相对于矩形网格的 Jaccard 分数/距离(距离为 1 分)。我的网格是 50x50(总共 1625625 个矩形)。我能够在 0.34 秒内针对所有这些计算出我的输入矩形的
elasticsearch - Elasticsearch 得分/排序-轮换类别
我有这样的文件(当然是简化的情况): Category: A, Rating: 10 Category: A, Rating: 9 Category: A, Rating: 5 Category: B
java - Libgdx 显示得分并每秒加 1 得分
我想每秒将分数增加 1 分，但我很难让它正常工作。例如 (伪代码): int score = 0f // on create updateEverySecond() { score += 1
ios - Facebook 游戏 iOS 得分
我现在正在制作一款新游戏，您可以在其中保存您的高分，但我不知道是否可以实现 Facebook 排行榜。这样用户就可以看到他们的 friend 并看到他们的高分是多少。这可能吗？好吧，我在不同的应用程序
C# 来自 Ruby Wilson 得分
谁能帮我把它转换成 C#。这真的伤害了我的大脑。 http://www.evanmiller.org/how-not-to-sort-by-average-rating.html require 's
ios - Sprite Kit 动态更新杀戮/得分/健康标签
最好的方法是什么才能让标签包含击杀数、生命值或随着与其相关的变量发生变化而更新的分数？目前我只是使用 SKLabelNode 并使用变量为其分配文本，但未计算文本属性，因此它在初始化后保持静态。每次更
javascript - Google PageSpeed 得分 - 1 渲染阻塞 CSS 文件
我有一个 Wordpress 网站。尝试使用 Google PageSpeed Insights Tool 获得 100/100 分数，但遇到 1 个“错误”。谷歌表示； Eliminate rend
google-pagespeed - V5 中的 Google Page Speed Insights 得分
自 V5 以来，与 V4 相比，评分发生了变化。该文档解释了性能、渐进式 Web 应用程序、可访问性、最佳实践和 SEO 的分数，但没有解释总体分数。根据图片，桌面版为 59。任何人都可以帮助我了解
ios - TLSphinx cmusphinx pocketsphinx 假设结果文本空字符串得分负 (-) 数字
我运行了自述文件中的示例代码 tryolabs/TLSphinx README.md ，Hypothesis的text属性的结果是空格，而score属性的结果是负数-4420。为什么我在假设的文本属
scikit-learn - sklearn metrics.log_loss 是正值 vs. 得分 'neg_log_loss' 是负值
确保我做对了: 如果我们使用 sklearn.metrics.log_loss独立的，即 log_loss(y_true,y_pred)，它产生一个正分数——分数越小，性能越好。但是，如果我们使用
javascript - 页面加载后在 React 中加载第三方 iframe，使 iframe 不影响 PageSpeed 得分
我有一个 iframe加载第三方小部件。我只想显示这个iframe在我的页面加载后，因为我不想减慢我的页面加载速度。我关注了 medium article其中描述了如何执行此操作，但他们的解决方案不起

首页

博学

6Ren·AI

商城

elasticsearch - Elasticsearch得分从0到1，用于搜索与现有文档相似的文档