gpt4 book ai didi

search - Lucene QueryParser 忽略搜索词 "BE"

转载 作者:行者123 更新时间:2023-12-02 05:40:22 26 4
gpt4 key购买 nike

我正在尝试搜索几个字段,除非我使用术语“BE”,否则它工作正常。在这种情况下,lucene 会简单地忽略该字段。如果我执行如下所示的操作,我会得到正确的结果,并且“查询”对象显示为“+flag:bf +type:cgo”。如果我将标志或类型术语设置为“BE”,则该部分搜索将被忽略。例如,如果我将查询字符串设置为“flag:\”BE\“和类型:\“CGO\”“查询对象将显示为:“+ type:cgo”,我将获得更多点击。 “类型”也会发生同样的情况 - 如果我将上一个示例中的“CGO”更改为“BE”,它将被忽略。我没有尝试过所有可能的 2 个字符组合(但我已经尝试过很多),但除了这个之外,所有组合都按预期工作。我没有使用任何停止条款。

谢谢,基因

String queryString = "flag:\"BF\" AND type:\"CGO\"";
QueryParser qp = new QueryParser(Version.LUCENE_30,
"type", new StandardAnalyzer(Version.LUCENE_30));

Query query = qp.parse(queryString);
IndexSearcher searcher = new IndexSearcher(reader.reopen());
TopDocs td = searcher.search(q, 5000);
logger.info("Found " + td.totalHits + " hits using " + query.toString() );

最佳答案

默认情况下,StandardAnalyzer 使用一组停用词从文本中的索引术语中排除“噪音”。我认为,在 StandardAnalyzer 的上下文中,“BE”通常被视为停用词。

幸运的是,您有几种选择

显而易见的方法是将一组空的停用词传递给所使用的 StandardAnalyzer 的构造函数。

但是,查看字段的名称(“标志”和“类型”),它们看起来并不完全像是要​​包含简单的文本,而更有可能包含编码的单词。考虑到这一点,您可能会发现关键字分析器更适合。

祝你好运

关于search - Lucene QueryParser 忽略搜索词 "BE",我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6458592/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com