gpt4 book ai didi

elasticsearch - 在不丢失所有内容的情况下在Elasticsearch中重新插入或重新标记

转载 作者:行者123 更新时间:2023-12-02 22:54:42 24 4
gpt4 key购买 nike

我正在使用Elasticserach 6.8,并且遇到以下情况:
我们部署了 flex 服务,几个月后,我们发现我们使用了错误的 token 生成器,或者如果愿意的话,没有对其进行规范化。

我们将原始数据以及一些标记化值存储在文档中。一种方法是简单地应用ascii折叠滤镜来实现以下目的:

Aplicação -> aplicacao
Açaí -> acai
Minha availiação -> [minha, avaliacao]

但是今天我们得到类似
Aplicação -> aplicação
Açaí -> açaí
Minha availiação -> [minha, avaliação]

有没有一种方法可以解决此问题,而不必像原始值那样重新插入所有内容?

编辑:我们正在使用UTF-8,通过归一化,我的意思是ASCII折叠过滤器的行为。

最佳答案

我相信您正在寻找reindex API:

https://www.elastic.co/guide/en/elasticsearch/reference/6.8/docs-reindex.html

如果您有_source可用,此API调用将允许您为文档重新索引。在重新索引之前,目标索引应具有正确的标记器,以便文档将应用ascii折叠。

关于elasticsearch - 在不丢失所有内容的情况下在Elasticsearch中重新插入或重新标记,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59184079/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com