gpt4 book ai didi

Solr 似乎在提交时阻止更新请求

转载 作者:行者123 更新时间:2023-12-03 17:56:41 28 4
gpt4 key购买 nike

我们正在使用以下自动提交选项使用 Solr 3.6 运行主从设置:

最大文档数:500000

最大时间:600000

我们的索引中有大约 500 万个文档,占用大约 550GB。我们在 Amazon EC2 XLarge 实例(4 个虚拟核心和 15GB)上同时运行主服务器和从服务器。我们没有特别高的写入吞吐量 - 每分钟大约 100 个新文档。

我们使用 Jetty 作为容器,并为其分配了 6GB。

问题是,一旦开始提交,我们所有的更新请求就会开始超时(我们不会针对此框执行查询)。提交本身似乎需要大约 20-25 分钟,在此期间我们无法向 Solr 添加任何新文档。

以下问题中的一个答案建议使用 2 个内核,并在完全更新后交换它们。然而,这似乎有点过头了。

Solr requests time out during index update. Perhaps replication a possible solution?

关于为什么 Solr 似乎阻止请求,我还有什么应该注意的吗?我乐观地希望在我忽略的配置中有一个“dontBlockUpdateRequestsWhenCommitting”标志......

非常感谢,

最佳答案

据赏金理由,在这里提问提到的问题是从Solr的一个解决方案:

Solr中有一个被称为SolrCloud与4.x版本的Solr的开头能力。代替以前的主/从架构,有领导者和副本。领导者有责任索引文件和副本的答案查询。系统由动物园管理员管理。如果领导者下山的副本之一被选为新的领导人。

总而言之,如果你想给你划分索引过程,是与SolrCloud OK自动,因为存在一个领导者,每个碎片,他们是负责索引其碎片的文件。当您向系统发送查询时,将有一些 Solr 节点(当然,如果 Solr 节点的数量超过分片数)不负责索引,但已准备好回答查询。当您添加多个副本,你会得到更快的查询结果(但索引时,它会导致更多的入站网络流量等)

关于Solr 似乎在提交时阻止更新请求,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10502313/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com