elasticsearch - 在Elasticsearch中对同义词进行平均评分-6ren

elasticsearch - 在Elasticsearch中对同义词进行平均评分

转载作者：行者123 更新时间：2023-12-02 22:29:38

24

4

我们可以在elasticsearch中对原始字符串和同义词进行均等的评分吗？

例如。我将同义词文件创建为:

pvt, private

ltd, limited

我使用同义词标记过滤器创建了一个索引。然后我索引了两个文档:

curl -XPOST "http://localhost:9200/test1/test?pretty" -d 
    '{ "entityName" : "ABC International Pvt Ltd"}'

curl -XPOST "http://localhost:9200/test1/test?pretty" -d 
    '{ "entityName" : "ABC International Private Limited"}'

现在，当我搜索“ABC International Pvt Ltd”时，它对第一个文档的得分为1.15，第二个文档的得分为0.57。

有没有办法平等对待同义词？

使用以下设置创建索引:

curl -XPUT 'localhost:9200/test1?pretty' -H 'Content-Type: application/json' -d'
{
    "settings" : {
        "index" : {
            "analysis":{
                "analyzer":{
                    "my_analyzer":{
                        "tokenizer":"standard",
                        "filter":["asciifolding", "standard", "lowercase", "my_metaphone", "synonym"]
                    }
                },
                "filter":{
                    "my_metaphone":{
                        "type":"phonetic",
                        "encoder":"metaphone",
                        "replace":false
                    },
                    "synonym" : {
                      "type" : "synonym", 
                      "synonyms_path" : "synonyms.txt",
                      "ignore_case" : "true"
                    }
                }
            }
        }
    }
}'

最佳答案

在创建索引的同时添加映射就可以了。如果没有映射，则甚至没有应用同义词标记过滤器。下面是我用来创建索引的命令。

curl -XPUT 'localhost:9200/test1?pretty' -H 'Content-Type: application/json' -d' 
{
"settings" : {
  "analysis":{
    "filter":{
      "my_metaphone":{
        "type":"phonetic",
        "encoder":"metaphone",
        "replace":false
      },
      "synonym" : {
        "type" : "synonym", 
        "synonyms_path" : "synonym.txt",
        "ignore_case" : "true"
      }
    },
    "analyzer":{
      "my_analyzer":{
        "type":"custom",
        "tokenizer":"standard",
        "filter":["asciifolding", "standard", "lowercase", "my_metaphone", "synonym"]
      }
    }
  }
},
"mappings": {
  "test": {
    "properties": {
      "text": {
        "type": "text",
        "analyzer": "my_analyzer", 
        "search_analyzer": "my_analyzer" 
      }
    }
  }
}
}'

关于elasticsearch - 在Elasticsearch中对同义词进行平均评分，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/46792559/

24

4

0

文章推荐： macos - Quartz Composer中的系统音频

文章推荐： svg - inkscape 转换 svg -> png : pagesize?

Elasticsearch建议+同义词+模糊性
我正在寻找一种方法来实现具有同义词和模糊性的自动建议例如，当用户试图搜索“replce ar”时我的同义词列表有 ar => 录音所以，结果应该包括匹配的项目改变录音更换录音等等，这里我们需要模
Python 文本匹配 - 同义词
我在 Pandas 中有两列:A 和 B，每列都包含术语字符串。我的目标是在 B 列中找到与 A 列最相似的条目。我已经在使用 TF-IDF 来执行此操作，但有时存在不明显匹配的同义词，例如货币和货币
oracle - 如何找出存储过程中使用了哪些表/ View /同义词
通过 Oracle 查询是否可以找出存储过程使用哪些 View /同义词/表？在 PL/SQL Developer 中，如果您折叠存储过程，它将显示“引用”，其中显示了存储过程使用的所有表/ Vie
oracle - 管理 Oracle 同义词
我正在阅读这篇文章: Managing Oracle Synonyms 关于优先顺序，在将对象名称解析为实际对象时，它说: 本地对象总是首先被访问。如果本地对象不存在，则将访问具有私有(privat
oracle - 如何正确地制作公共(public)同义词
这是一个非常愚蠢的问题，但我需要帮助。我有一张 mydbowner 拥有的 table 。它被命名为 mydbowner.mytable。我试图通过发出命令来创建一个公共(public)同义词: 为
elasticsearch - 同义词 token 过滤器
我用同义词标记过滤器创建了一个测试索引 PUT /synonyms-index { "settings": { "analysis": { "filter": { "my_synonym_filte
search - 同义词，将权重存储在文档中以在Elastic Search中进行相关性评分
故事:给定下面的示例文档并通过扩展它们，有可能获得以下排名: 对“ Cereal ”的搜索结果显示以下排名 Jade 米片水稻脆饼搜索“大米”会得出以下排名印度香米水稻脆饼执行针对搜索的文档
elasticsearch - 实时更新 Elasticsearch 同义词
背景: 一直以来，我一直认为，如果同义词文件中有任何更改，您将需要重新索引整个索引。当然，如果索引大小很小，过程不会那么慢，但是过程本身很乏味，并且会有停机时间。所以问题: 在这种情况下，我的理解有
java - 同义词 HashMap 的正确用法
我正在尝试将给定单词的同义词存储到HashMap中。然后，我接受用户输入并检查它是否是一个单词或其同义词。例如，假设主要词是“bank”，其同义词是“safe”、“tresury”和“credit u
ant - Ant 目标的别名/同义词
我有一个名为“unittest”的 Ant 目标，我觉得它很笨重，我想改用“test”。我需要保留名称“unittest”，因为其他人也使用 ant 构建文件。有没有办法为特定目标添加别名或同义词？
mysql - 同义词、外连接、单行字符串函数
关闭。此题需要details or clarity 。目前不接受答案。想要改进这个问题吗？通过 editing this post 添加详细信息并澄清问题. 已关闭 7 年前。 Improve th
lucene - 动态更改 elasticsearch 同义词
是否可以在索引中存储elasticsearch的同义词？或者是否可以从像 couchdb 这样的数据库中获取同义词列表？我想通过 REST-API 向 elasticsearch 动态添加同义词。最
mysql - 同义词、外连接、单行字符串函数
我如何从订单表中返回员工 ID 和每个员工处理的订单总数，并将总数从大到小排序。最佳答案使用 GROUP BY 计算每个员工的订单数量，并使用 ORDER BY 对结果进行排序。 SELECT e
elasticsearch - ElasticSearch 的停用词/同义词/等文件
我曾经使用 Solr，它会有包含停用词、同义词等文件的配置文件夹。每次进行更改时，您都可以使用 Zookeeper 下载 conf 文件，然后将其上传并分发到集群中的所有服务器。 ElasticSea
python - 查找相似/同义词/上下文单词 Python
您好，我正在寻找问题的解决方案:我想找到与法语和英语相似的单词列表例如 :名字可以是:名字、姓氏、化名、普雷诺姆、用户名......邮政地址可以是:城市、国家、街道、维尔、付款、邮政编码......
elasticsearch - 读取onymous_path_path时发生IOException(同义词 token 过滤器)
我在自定义文件中使用同义词标记过滤器在Windows 10计算机上将Elasticsearch 6.7安装为服务我的同义词。txt位于C:\ProgramData\Elastic\Elastics
ruby-on-rails - Elasticsearch 同义词-Rails
我正在将Ruby on Rails与elasticsearch-rails gem一起使用，并且尝试使用同义词过滤器。我一直在关注此处发布的问题以寻求指导(我的实现按预期工作，但同义词部分除外): h
elasticsearch - 使用预先存在的索引设置基本 ElasticSearch + WordNet 同义词
我正在尝试学习如何将“同义词功能”正确添加到我现有的 ElasticSearch 设置中。到目前为止，这是我对这个过程的理解。如果您能指出我的任何误解，我将不胜感激 - 我是 elasticsearc
java - MyBatis 生成器中的私有(private)同义词
我正在使用 Mybatis 生成器生成对象。我能够在该模式中生成具有实际表名的类。但授予该表上不同模式的选择权限并创建了一个私有(private)同义词。我想使用该同义词生成对象。
python - Python 中的阿拉伯语 Wordnet 同义词？
我正在使用 python 2.7，我正在尝试使用阿拉伯语 WordNet 获取阿拉伯语单词的同义词我下载了两个需要的文件: AWNDatabaseManagement.pyupc_db.xml 当我

首页

博学

6Ren·AI

商城

elasticsearch - 在Elasticsearch中对同义词进行平均评分