gpt4 book ai didi

java - ElasticSearch QueryBuilder must_not 子句奇怪的行为

转载 作者:行者123 更新时间:2023-11-30 10:11:39 25 4
gpt4 key购买 nike

根据文档

must_not The clause (query) must not appear in the matching documents.

我有这样的查询:

// searching for URI which contains smart and doesn't contain vip.vs.csin.cz
BoolQueryBuilder builder = QueryBuilders.boolQuery();
builder.must(QueryBuilders.termQuery(URI, "smart")));
builder.mustNot(QueryBuilders.termQuery(URI, "vip.vs.csin.cz")));

我的 elasticsearch 存储库中有两个 URI

1)

/smart-int-vip.vs.csin.cz:5080/smart/api/runtime/case/SC0000000000558648/record/generate/4327/by/SMOBVA002/as/true?espisRecordForm=ANALOG&accountNumber=2318031033/0800

2)

/smart/api/runtime/case/SC0000000000558648/record/generate/4327/by/SMOBVA002/as/true?espisRecordForm=ANALOG&accountNumber=2318031033/0800

当我通过 ElasticSearchTemplate 执行查询时

elasticsearchTemplate.getClient().search(searchRequest);

我得到了 0 条记录。当我在没有 mustNot 子句的情况下执行相同的查询时,我得到了 2 条记录。
在 kibana 我可以写:

uri: "smart" NOT uri: "vip.vs.csin.cz"

并按预期获得 1 条记录

我期望 Java ElasticSearchClient 具有相同的行为。我如何从 Java 中过滤包含“vip.vs.csin.cz”的记录,以及为什么它过滤了第二条记录,即使它不包含我指定的 mustNot 子句中的任何内容?

编辑这里是我的映射

@Document(indexName = "audit-2018", type = "audit")
public class Trace {

@Id
private String id;
@Field(type = FieldType.Text)
private String uri;

// more columns, getter & setters
}

最佳答案

您提供的 Java 代码显示了一个使用 mustmust_not 子句的 bool 查询,其中您正在执行一个 term 查询。关于术语查询的事情是它们受制于你在你的字段上的分析器,text 的标准分析器(这是你的 uri 字段的数据类型,read more here ) 字段将删除所有标点符号(换句话说,您单词中的点)并将您的单词拆分。 vip.vs.csin.cz 变为 vip vs csin cztext 字段类型应该只保留用于全文搜索,在你的情况下我会选择 keyword 字段类型( read more here )你的 Kibana 查询按预期工作的原因是因为那个实际上不是在执行术语查询,而是包含 lucene 查询的 query_string 查询:uri: "smart"NOT uri: "vip.vs.csin.cz"

所以您有几个选项可以解决您的问题。您可以将您的条款查询更改为 match_phrase 查询,这将允许您保留标记化条款的顺序,并可能获得正确的结果。另一种方法是在您的 Java 代码中执行 query_string 查询而不是 terms 查询,因为您已经确定这确实会给您正确的结果。

不过,我建议的解决方案是使用字段类型为 keyworduri 重新编制索引,因为此字段类型不会导致将您的字段值不必要地标记为多个术语.您可以阅读有关 keyword 字段类型 here 的默认分析器和分词器的更多信息。这会让您在将来省去麻烦,因为您知道您的查询与您的字段值完全“按原样”匹配。

关于java - ElasticSearch QueryBuilder must_not 子句奇怪的行为,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52345482/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com