gpt4 book ai didi

elasticsearch - 如何从elasticsearch的默认_英语_停用词列表中删除停用词?

转载 作者:行者123 更新时间:2023-12-02 23:51:00 26 4
gpt4 key购买 nike

我正在使用默认的英语停用词过滤文本。我发现“and”是英语中的停用词,但我需要搜索包含“and”的结果。我只想从此默认英语停用词过滤器中删除and词,并像往常一样使用其他停用词。我的elasticsearch模式看起来与下面类似。

"settings": {
"analysis": {
"analyzer": {
"default": {
"tokenizer": "whitespace" ,
"filter": ["stop_english"]
}
}....,
"filter":{
"stop_english": {
"type": "stop",
"stopwords": "_english_"
}
}

我希望看到包含带有_search api的 AND字的文档。

最佳答案

您可以像这样手动给定索引set the stop words:

PUT /my_index
{
"settings": {
"analysis": {
"filter": {
"my_stop": {
"type": "stop",
"stopwords": ["and", "is", "the"]
}
}
}
}
}

我还找到了elasticsearch here使用的英语停用词列表。如果您设法在索引中手动设置相同的停用词列表减去“和”,并使用良好的停用词为新配置的索引中的数据重新索引,那么您应该一切顺利!

关于数据的重新索引编制,应检查 reindex api。我认为这是必需的,因为数据的标记化发生在摄取时,因此您需要通过重新编制索引来重做摄取。在大多数情况下,更改索引设置或某些映射更改时需要这样做(不是100%肯定,但是我认为这很有意义)。

关于elasticsearch - 如何从elasticsearch的默认_英语_停用词列表中删除停用词?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57708353/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com