gpt4 book ai didi

elasticsearch - 使用ngram在文本内搜索搜索模式的最小字符

转载 作者:行者123 更新时间:2023-12-02 23:27:39 25 4
gpt4 key购买 nike

我的 flex 服务器中有一个文本索引。
我已经实现了一个ngram标记器,如下所示:

"analysis": {
"analyzer": {
"ngram_analyzer": {
"type": "custom",
"tokenizer": "ngram_tokenizer"
}
},
"tokenizer": {
"ngram_tokenizer": {
"type": "ngram",
"min_gram": "3",
"max_gram": "7"
}
}
},

可以说我的数据是

“你好美丽的世界ell”

当我放置查询匹配“ hell ”时
我希望它仅找到第一个单词(Hello),而不是ell,所以基本我不希望它“破坏”我的搜索模式只是为了在我的数据中按原样查找它(有4个字符,且不低于3个字符)

谢谢

最佳答案

解决方案是更改分析器中的标记器。

例如,您可以像

"some_analyzer": {
"type": "custom",
"tokenizer": "whitespace",
"filter": [ "lowercase" ]
}

重要的是您的搜索分析器没有nGram标记器。

关于elasticsearch - 使用ngram在文本内搜索搜索模式的最小字符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40995166/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com