gpt4 book ai didi

search - 更改Stemmer时是否应该在Elasticsearch中为文档重新编制索引?

转载 作者:行者123 更新时间:2023-12-03 02:05:47 25 4
gpt4 key购买 nike

我正在使用Elasticsearch为我的文档建立索引(尽管我相信我的问题也可以适用于任何其他搜索引擎,例如Lucene或Solr)。

我在索引时间使用Porter stemmer和停用词列表。我知道我应该使用相同的词干分析器,并在搜索时停止单词去除,以获得正确的结果。

我的问题是,如果我决定更改词干或在停用词列表中添加/删除几个单词,该怎么办? 是否应为所有文档(或所有文本字段)重新索引以应用更改?还是有其他方法可以处理这种情况?

最佳答案

是的,如果您需要大幅度更改分析仪,则必须重新编制文档索引。否则,更改只会影响查询分析。在更改StopFilter时,您也许可以避免这种情况,但在更改词干分析器时,则无法解决。重新索引是对索引数据应用新分析规则的唯一方法,无论是通过转储整个对象并从头开始对其进行重建还是通过更新文档来进行重新索引。

至于其他方法,如果您不希望重新编制索引,则只能将分析更改限制为查询时间,这会极大地限制您可以执行的操作(可以使SynonymFilter有效,但同样,对茎的更改肯定是出来)。

关于search - 更改Stemmer时是否应该在Elasticsearch中为文档重新编制索引?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26261492/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com