gpt4 book ai didi

elasticsearch - Elasticsearch外语停用词

转载 作者:行者123 更新时间:2023-12-02 23:41:12 25 4
gpt4 key购买 nike

我是Elasticsearch的新手,正在尝试进行一些测试,但是,在使用(在这种情况下)法语分析器和停用词方面,我遇到了一个问题。这是我设置的索引:

test1: {

state: open
settings: {
index.analysis.analyzer.french.tokenizer: standard
index.analysis.filter.stop_fr.stopwords.0: _french_
index.analysis.filter.stop_fr.type: stop
index.analysis.analyzer.french.filter.1: stop_fr
index.analysis.analyzer.french.filter.0: lowercase
index.analysis.analyzer.french.type: custom
index.number_of_shards: 5
index.number_of_replicas: 1
index.version.created: 900299
}

但是,当我从ES Head运行'Test Analyser'工具时,法语停用词仍可以通过,而英语停用词(the,a等)则无法通过。任何见识将不胜感激。谢谢!

最佳答案

您还应该更改索引映射设置。

索引由default_analyzer自动分析,这当然会删除英语停用词。具有两种类型的信息contenttime的示例映射

"testindex": {
"testtype": {
"search_analyzer": "test_analyzer", // <-- search_analyzer
"properties": {
"content": {
"type": "string",
"store": true,
"analyzer": "test_analyzer" // <-- index_analyzer
},
"time": {
"type": "date",
"store": true,
"format": "dateOptionalTime"
}
}
}
}

关于elasticsearch - Elasticsearch外语停用词,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17910563/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com