gpt4 book ai didi

elasticsearch - ElasticSearch 的停用词/同义词/等文件

转载 作者:行者123 更新时间:2023-12-04 06:20:31 31 4
gpt4 key购买 nike

我曾经使用 Solr,它会有包含停用词、同义词等文件的配置文件夹。每次进行更改时,您都可以使用 Zookeeper 下载 conf 文件,然后将其上传并分发到集群中的所有服务器。

ElasticSearch 的新手,所以请原谅这个问题:有没有办法让我自动创建这样的文件并让 Zookeeper 或其他东西自动分发它而不是手动步骤(或 Puppet 脚本)

根据这个:http://www.elastic.co/guide/en/elasticsearch/guide/master/using-synonyms.html文件必须存在,但没有提及如何存在。

另外,我发现了这个:https://github.com/lindstromhenrik/elasticsearch-analysis-file-watcher-synonym不确定它是否有效。上面的日期似乎不太乐观。

最佳答案

如何分发文件超出了我回答您问题的能力范围,但是:

“同义词”的外部文件,如“停用词”,在两种情况下被读取:

  • 当您创建分析器时
  • 当你重启你的节点时

该指南有一节介绍如何 update the stopwords列表。这也适用于同义词。

在我的实践中,我发现直接在 JSON 负载中提供同义词更容易。避免我对服务器、文件位置等实际基础设施“了解太多”。

关于elasticsearch - ElasticSearch 的停用词/同义词/等文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30132959/

31 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com