gpt4 book ai didi

elasticsearch - 是否有 Elasticsearch 的词干分析器可以将 "broken"更改为 "break"

转载 作者:行者123 更新时间:2023-12-03 00:59:03 24 4
gpt4 key购买 nike

这是我希望词干分析器执行的操作:
破:破
破:破
破:破
输入:输入
输入:输入
输入:输入

我已按如下方式对该字段进行了索引:
“ body ”: {
“类型”:“文本”,
“字段”:{
“词干提取”:{
“类型”:“文本”,
“分析器”:“英语”
}
}
}

当我查询“break and enter”时,我可以看到在 body.stemmed 字段中搜索的是:“break and enter”。看起来不错。
但是,当我查询“broke and enter”时,我得到:“broke and enter”。因此,显然,当使用“english”词干分析器时,“broke”不会变成“break”。
同样,“破而入”变成:“破而入”。因此,ES 显然不会将“损坏”或“损坏”更改为“中断”(根据此:snowball,我想解释了为什么如果这是使用的)。

那么,有没有办法指定一个“已知”的词干分析器来完成我想要做的事情?

最佳答案

您的要求可以通过 Dictionary Stemmer 来满足,它对词干进行字典查找。算法词干分析器在不了解词根的情况下进行词干提取,他们只是通过算法进行操作。
看看 Hunspell 词干分析器,认为它会完成这项工作:
https://www.elastic.co/guide/en/elasticsearch/guide/current/hunspell.html

关于elasticsearch - 是否有 Elasticsearch 的词干分析器可以将 "broken"更改为 "break",我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40431071/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com