gpt4 book ai didi

solr - 在 Solr 中,为什么对索引和查询使用不同的分析器?

转载 作者:行者123 更新时间:2023-12-04 23:27:33 25 4
gpt4 key购买 nike

为什么要使用不同的分析器进行索引与查询,是否有充分的理由?在示例 schema.xml 文件中,例如,对于 text_en_splitting,索引分析器不进行同义词扩展,但查询会进行。这只是为了保持索引尽可能小吗?类似地,对于 WordDelimiterFilterFactory,索引分析器有 catenateWords="1"和 catenateNumbers="1",而查询分析器将它们设置为 0。这只是为了保持查询小(快速)吗?这些优化真的值得让两个“几乎相同”的分析仪进行维护噩梦吗?

谢谢!

最佳答案

在索引时和查询时不需要同义词扩展,只需要这两者之一。
想想看,如果你只在索引时这样做,所有列出的词都会被它的所有同义词补充。
然后,当您使用这些词中的任何一个查询索引时,您将匹配所有经过扩展的文档。

没有必要在两端扩展。
并且建议您在索引时执行此操作,因为这样可以加快查询时间。

恕我直言,一般规则应该是尽你所能(包括在查询时扩展同义词的几毫秒),以使用户体验更好。这些筹码可以大量堆积。

您可以问同样的问题,为什么我们鼓励文档中的数据冗余。

关于solr - 在 Solr 中,为什么对索引和查询使用不同的分析器?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10185079/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com