gpt4 book ai didi

java - MarkLogic 通配符搜索 - 控制台与 Java API

转载 作者:塔克拉玛干 更新时间:2023-11-02 08:02:19 26 4
gpt4 key购买 nike

我相信我从基于 Java 的查询中看到了不同的结果,我相信查询控制台中的等效 cts:search。这里有很多信息,我试着适本地组织一下。以下是设置一个简单示例以复制我所看到的内容的步骤。

  1. 使用默认设置创建新数据库
  2. 使用默认设置添加新林
  3. 启用三个字符搜索(仅限非默认数据库设置)
  4. 将下面三个json文件插入数据库

查询控制台返回 doc2。 Java 客户端返回 doc2 和 doc1。为什么?我希望每个人都能得到相同的结果。我想在 Java 中获取查询控制台返回的结果。我是不是用 Java 错误地编写了查询定义?

看起来 Java 客户端通配符搜索正在搜索整个文档,即使我已经指定我只想在给定的 json-property(名称)内进行通配符搜索。

在给定客户端 RawCombinedQueryDefinition 的情况下,是否有办法查看或记录生成的服务器端“cts 查询”?我想看看 Java 请求在服务器端被翻译成了什么。

doc1.json

{
"state": "OH",
"city": "Dayton",
"notes": "not Cincinnati"
}

doc2.json

{
"state": "OH",
"city": "Cincinnati",
"notes": "real city"
}

doc3.json

{
"state": "OH",
"city": "Daytona",
"notes": "this is a made up city"
}

用于插入文档的查询控制台代码

xquery version "1.0-ml"; 
xdmp:document-load("/some/path/doc1.json",
<options xmlns="xdmp:document-load">
<uri>/doc1.json</uri>
</options>
);

用于搜索的查询控制台代码

xquery version "1.0-ml";
cts:search(fn:collection(),
cts:and-query((
cts:json-property-value-query("state", "OH"),
cts:json-property-value-query("city", "*Cincinnati*")
))
)

Java QueryManager 查询以易于阅读的文本显示

{
"search": {
"query": {
"queries": [
{
"value-query": {
"type": "string",
"json-property": "state",
"text": "OH"
}
},
{
"value-query": {
"type": "string",
"json-property": "city",
"text": "*Cincinnati*"
}
}
]
}
}
}

Java代码

import com.marklogic.client.DatabaseClient;
import com.marklogic.client.DatabaseClientFactory;
import com.marklogic.client.document.DocumentPage;
import com.marklogic.client.document.DocumentRecord;
import com.marklogic.client.document.JSONDocumentManager;
import com.marklogic.client.io.Format;
import com.marklogic.client.io.StringHandle;
import com.marklogic.client.query.QueryManager;
import com.marklogic.client.query.RawCombinedQueryDefinition;
import org.junit.Test;

public class MarkLogicTest
{
@Test
public void testWildcardSearch()
{
DatabaseClientFactory.SecurityContext securityContext = new DatabaseClientFactory.DigestAuthContext("admin", "admin");
DatabaseClient client = DatabaseClientFactory.newClient("localhost", 8000, "test", securityContext);
QueryManager queryManager = client.newQueryManager();
JSONDocumentManager documentManager = client.newJSONDocumentManager();

String query = "{\n" +
" \"search\": {\n" +
" \"query\": {\n" +
" \"queries\": [\n" +
" {\n" +
" \"value-query\": {\n" +
" \"type\": \"string\",\n" +
" \"json-property\": \"state\",\n" +
" \"text\": \"OH\"\n" +
" }\n" +
" },\n" +
" {\n" +
" \"value-query\": {\n" +
" \"type\": \"string\",\n" +
" \"json-property\": \"city\",\n" +
" \"text\": \"*Cincinnati*\"\n" +
" }\n" +
" }\n" +
" ]\n" +
" }\n" +
" }\n" +
"}";

StringHandle queryHandle = new StringHandle(query).withFormat(Format.JSON);
RawCombinedQueryDefinition queryDef = queryManager.newRawCombinedQueryDefinition(queryHandle);
DocumentPage documents = documentManager.search(queryDef, 1);

while (documents.hasNext())
{
DocumentRecord document = documents.next();
StringHandle resultHandle = document.getContent(new StringHandle());
String result = resultHandle.get();
System.out.println(result);
}
}
}

System.out.println() 结果

{"state":"OH", "city":"Dayton", "notes":"not Cincinnati"} 
{"state":"OH", "city":"Cincinnati", "notes":"real city"}

为什么 Java 客户端返回第一个结果 where city = Dayton?

提前致谢!

最佳答案

默认情况下,REST API 和 Java API 会执行未过滤的搜索(也就是说,匹配完全基于索引)。相比之下,cts:search() 默认执行过滤搜索(意味着检查结果文档以排除误报)。

如果将“未过滤”选项添加到 cts:search(),它还会返回两个文档。

快速解决方案是将“过滤”选项添加到 Java API 搜索,但更好的大规模性能解决方案是优化索引以支持所需通配符查询的精确匹配。

元素根据位置与通配符相关联。

因此,对于此查询,我认为您需要为元素词位置和三个字符词位置打开索引配置。

希望对你有帮助,

关于java - MarkLogic 通配符搜索 - 控制台与 Java API,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48024249/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com