gpt4 book ai didi

optimization - 保持索引实时的最佳方法?

转载 作者:行者123 更新时间:2023-12-03 15:27:46 25 4
gpt4 key购买 nike

我有一个大约 700 Gb 的 Solr/Lucene 索引文件。我需要索引的文档正在被实时读取,每 30 分钟大约有 1000 个文档被提交并需要被索引。在我的场景中,每 30 分钟运行一次脚本,为尚未编入索引的文档编制索引,因为要求新文档尽快可搜索,但此过程会减慢搜索速度。

这是我可以索引最新文档的最佳方式还是有其他更好的方式!

最佳答案

首先,请记住 Solr 还不是实时搜索引擎(还)。还有work要做。

您可以使用 master/slave setup ,其中索引在主服务器上完成,搜索在从服务器上完成。这样,索引不会影响搜索性能。在主服务器上完成提交后,强制从服务器从主服务器获取最新索引。当新索引正在从属服务器上复制时,它仍在处理使用先前索引的查询。

另外,检查你cache warming settings .请记住,如果这些设置过于激进,这可能会减慢搜索速度。还要检查在 new searcher event 上启动的查询.

关于optimization - 保持索引实时的最佳方法?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4015039/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com