gpt4 book ai didi

node.js - 如何在 Elasticsearch 中对字段类型 '' 文本进行排序

转载 作者:搜寻专家 更新时间:2023-11-01 00:16:23 25 4
gpt4 key购买 nike

我正在研究 Elasticsearch 多字段排序查询,我有以下格式的数据:

{
"person_name" : "Abraham Benjamin deVilliers",
"created_on": "Tue, 02 Apr 2018 16: 17: 54 GMT",
"name": "Abraham",
"office":{
"name":"my_office"
}
},
{
"person_name" : "John Bradshaw",
"created_on": "Thu Apr 05 2018 14:42:30 GMT",
"name": "jhon",
"office": {
"name":"Abraham deVilliers"
}
},
{
"person_name" : "John Bradshaw",
"created_on": "Tue, 03 Apr 2018 11: 39: 17 GMT",
"name": "Abraham deVilliers",
"office": {
"name":"blabla"
}
}

其中字段person_nametext 类型,created_onstring 类型。我必须根据字段 person_namecreated_on 对上述响应进行排序。

我们尝试的查询如下:

GET /my_index/_search

{
sort: [{
"person_name": { "order": "asc" },
"created_on": { "order": "desc" }
}]
}

在使用上述查询对响应进行排序时出现以下错误:

message: '[illegal_argument_exception] Fielddata is disabled on textfields by default. Set fielddata=true on [person_name] in order toload fielddata in memory by uninverting the inverted index. Note thatthis can however use significant memory. Alternatively use a keywordfield instead.'

在搜索中,我们发现需要将字段person_name 的映射从text 类型修改为keyword 类型。但是我们无法修改现有映射,因为它已经包含数百万条记录。

有没有其他方法可以在不改变现有 Elasticsearch 映射的情况下对 text 字段执行排序查询?

我们将不胜感激。

最佳答案

有两种方法可以完成您的需要。

  1. 添加新字段 multi-fields .当使用多字段时,每次索引一个新字段时,elasticsearch 会自动为您所指的字段应用不同的分析器逻辑。 raw字段不做分析,即一共是一个term,可以用来排序。为此,您必须更新映射,然后使用 reindex api为了更新您的数据(您基本上创建了一个新索引,然后切换您的应用程序以使用新索引而不是旧索引,为了在不停机的情况下执行此操作,您可以使用 alias )。另一种更新索引而不创建新索引的方法是使用 update_by_query api .
  2. 如果您只是想让这种排序在不更改任何内容的情况下工作,您可以使用 scripting .基本上你会选择保存的值并根据它进行排序。但这不适合扩展使用。这既快又脏,所以要小心对待。

所有链接指向elasticsearch官方文档。

关于node.js - 如何在 Elasticsearch 中对字段类型 '' 文本进行排序,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49672496/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com