gpt4 book ai didi

elasticsearch - 重新使用内置语言过滤器?

转载 作者:行者123 更新时间:2023-12-02 23:16:33 24 4
gpt4 key购买 nike

我看到了here问题,它显示了如何创建自定义分析器以同时支持同义词和对语言的支持。

但是,它似乎也创建了自己的词干提取器和停用词集合。

如果我想向“丹麦式”内置分析仪添加同义词怎么办?我可以引用内置的丹麦词干和停用词过滤器吗?例如,它仅称为danish_stemmerdanish_stopwords吗?

也许内置过滤器列表会有所帮助-在哪里可以看到这些内置过滤器的名称?

最佳答案

对于每个预构建的语言分析器,都有一个如何重建它的示例。对于 danish ,有以下示例:

PUT /danish_example
{
"settings": {
"analysis": {
"filter": {
"danish_stop": {
"type": "stop",
"stopwords": "_danish_"
},
"danish_keywords": {
"type": "keyword_marker",
"keywords": ["eksempel"]
},
"danish_stemmer": {
"type": "stemmer",
"language": "danish"
}
},
"analyzer": {
"rebuilt_danish": {
"tokenizer": "standard",
"filter": [
"lowercase",
"danish_stop",
"danish_keywords",
"danish_stemmer"
]
}
}
}
}
}

这实际上是在构建自己的 custom analyzer

可用的词干提取器列表可以在 here中找到。可用的预建停用词列表的列表可以在 here中找到。

希望有帮助!

关于elasticsearch - 重新使用内置语言过滤器?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54124285/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com