gpt4 book ai didi

Lucene 搜索和下划线

转载 作者:行者123 更新时间:2023-12-04 08:46:31 29 4
gpt4 key购买 nike

当我使用 Luke要使用标准分析器搜索我的 Lucene 索引,我可以看到我正在搜索的字段包含 MY_VALUE 形式的值。
然而,当我搜索 field:"MY_VALUE"时,查询被解析为 field:"my value"

有没有一种简单的方法来转义下划线 (_) 字符以便它搜索它?

编辑:

2010 年 4 月 1 日太平洋标准时间上午 11:08

我认为 Lucene 2.9.1 的标记器中存在一个错误,并且之前可能存在过。
加载 Luke 并尝试搜索“BB_HHH_FFFF5_SSSS”,当有数字时,返回以下标记:

“bb hhh_ffff5_ssss”

经过一些测试,我发现这是因为数字。如果我输入

“BB_HHH_FFFF_SSSS”,我明白了

“bb hhh ffff ssss”

在这一点上,我倾向于标记器错误,除非数字的存在应该具有这种行为,但我不明白为什么。

任何人都可以证实这一点吗?

最佳答案

看起来您没有使用 StandardAnalyzer 来索引该字段。在 Luke 中,您需要选择用于索引该字段的分析器,以便正确匹配 MY_VALUE。

顺便说一下,您可以使用 KeywordAnalyzer 匹配 MY_VALUE。

关于Lucene 搜索和下划线,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2520479/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com