gpt4 book ai didi

elasticsearch - Elasticsearch字词查询不匹配的URL

转载 作者:行者123 更新时间:2023-12-03 01:01:04 26 4
gpt4 key购买 nike

我是Elastic搜索的初学者,并且从上周开始从事POC工作。
我的文档中有一个URL字段,其中包含以下格式的URL:“http://www.example.com/foo/navestelre-04-cop”。

我无法定义到整个对象的映射,因为除URL之外,每个对象都有不同的键。

这是我创建索引的方式:

POST 
{
"settings" : {
"number_of_shards" : 5,
"mappings" : {
"properties" : {
"url" : { "type" : "string","index":"not_analyzed" }
}
}
}
}

我从一些资源中学到的将URL字段保持为not_analyzed,将一个字段标记为not_analyzed可以防止对其进行标记化,因此我可以在术语查询中查找该字段的完全匹配项。

我也尝试过使用空格分析器作为URL值,因此没有任何空格字符。但是我还是无法成功获得成功。

以下是我的学期查询:
{
"query":{
"constant_score": {
"filter": {
"term": {
"url":"http://www.example.com/foo/navestelre-04-cop"
}
}
}
}

}

我猜问题出在分析器和分词器中,但我无法解决。任何形式的帮助都可以增进我的知识,并且可以帮助我寻求解决方案。
提前致谢。

最佳答案

您有正确的想法,但看来您的设置请求中有些小错误使您误入歧途。这是最终的索引请求:

POST /test
{
"settings": {
"number_of_shards" : 5
},
"mappings": {
"url_test": {
"properties": {
"url": {
"type": "string",
"index": "not_analyzed"
}
}
}
}
}

注意在映射中添加的 url_test类型。这使ES知道您的映射适用于此文档类型。另外, settingsmappings也是根对象的不同键,因此必须分开。因为您的初始设置请求格式错误,所以ES只是忽略了它,并在文档上使用了标准分析器,这导致您无法使用查询来查询它。我将您指向 the ES Mapping docs

我们可以索引两个文档以进行测试:
POST /test/url_test/1
{
"url":"http://www.example.com/foo/navestelre-04-cop"
}

POST /test/url_test/2
{
"url":"http://stackoverflow.com/questions/37326126/elastic-search-term-query-not-matching-urls"
}

然后执行您未修改的搜索查询:
GET /test/_search
{
"query": {
"constant_score": {
"filter": {
"term": {
"url": "http://www.example.com/foo/navestelre-04-cop"
}
}
}
}
}

产生以下结果:
"hits": [
{
"_index": "test",
"_type": "url_test",
"_id": "1",
"_score": 1,
"_source": {
"url": "http://www.example.com/foo/navestelre-04-cop"
}
}
]

关于elasticsearch - Elasticsearch字词查询不匹配的URL,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37326126/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com