gpt4 book ai didi

elasticsearch - Elasticsearch 中的词根替换原始字符串

转载 作者:行者123 更新时间:2023-12-03 00:54:28 29 4
gpt4 key购买 nike

我使用以下设置来创建ES索引。

"settings": {
"analysis" : {
"analyzer" : {
"my_analyzer" : {
"tokenizer" : "standard",
"filter" : ["standard", "lowercase", "my_stemmer"]
}
},
"filter" : {
"my_stemmer" : {
"type" : "stemmer",
"name" : "english"
}
}
}
}

我注意到在分析词干分析器时,将原始字符串替换为词干词。有没有办法同时索引原始字符串和词干标记?

最佳答案

您的问题是关于stemmer token filter的“preserve_original”参数:

您会发现“preserve_original”,例如用于Word Delimiter Token Filter,但不用于词干标记过滤器。

如果您需要原始字词,例如要进行汇总,您可以使用适合的分析器将字段copy转换为另一个字段。

如果在索引的相同位置上需要原始文件,则必须包装词干分析器,并将自己的分析器构建为plugin

关于elasticsearch - Elasticsearch 中的词根替换原始字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46609632/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com