gpt4 book ai didi

lucene - 带有停用词的模糊搜索在Lucene/ElasticSearch中产生意外结果

转载 作者:行者123 更新时间:2023-12-02 22:41:43 25 4
gpt4 key购买 nike

我注意到停用词上的模糊运算符不会产生我期望的结果。

这是我的配置:

index :
analysis :
analyzer :
my_analyzer :
tokenizer : my_tokenizer
filter : [standard, my_stop_english_filter]

tokenizer :
my_tokenizer :
type : standard
max_token_length : 512

filter :
my_stop_english_filter :
type : stop
stopwords : [the]
ignore_case : true

并假设我已建立索引:
棕狐

如果我搜索:
the brown〜fox〜,然后我按预期获得了成功。

但是,如果我搜索: the〜brown〜fox〜,那么我不会受到打击,这可能是因为模糊运算符阻止了 被视为停用词。

有没有办法将停用词与模糊搜索结合起来?

谢谢,
埃里克

最佳答案

如果我没记错的话,这就是Lucene应该按照目前的方式工作的方式-使用模糊搜索禁用停用词的停止。这将需要一些工作,但是您可以创建查询解析器的修改版本,以便在应用模糊搜索时忽略停用词(但是如何对看起来像停用词的内容进行模糊搜索呢?)

关于lucene - 带有停用词的模糊搜索在Lucene/ElasticSearch中产生意外结果,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25143080/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com