gpt4 book ai didi

SolrCloud 与 Solr 主从复制

转载 作者:行者123 更新时间:2023-12-02 11:53:14 24 4
gpt4 key购买 nike

本周我遇到了 Solr 索引的问题:http://lucene.472066.n3.nabble.com/corrupted-index-in-slave-td4054769.html ,

今天,几乎每个请求都开始不断发生该错误,我创建了一个 JIRA 问题,因为我认为这是一个错误 https://issues.apache.org/jira/browse/SOLR-4707

正如你所读到的,最后是由于 Solr 主从复制失败,现在我不知道是否应该考虑迁移到 SolrCloud,因为 Solr 主从复制似乎不符合我们的要求:

  • 索引大小:约 2000 万个文档,约 9GB
  • ~1200 次更新/分钟
  • ~10000 次查询/分钟(分布在 2 个从属设备上)MoreLikeThis、RealTimeGet、TermVectorComponent、SearchHandler

如果有人能帮助我回答这些问题,我将非常感谢:

  • 建议迁移到 SolrCloud 吗?会对复制性能产生影响吗?
  • 那么,什么会有更好的性能呢?在每台服务器中维护索引的副本,还是使用分片服务器?
  • 您建议使用多少个分片和副本来确保高可用性?

亲切的问候,

维克多

最佳答案

好吧,您所有问题的答案取决于您到底想从 solrcloud 获得什么。

  • 是的,建议迁移到 solrcloud,因为它提供高可用性、可扩展性和近实时搜索以及自动热复制。但这些功能的代价是性能略有下降(即使在配置良好的集群中,您也希望得到通知)。
  • 我建议您应该使用共享配置来允许 solr 为您维护索引数据(我相信如果您这样做,您会给 TechOps 人员带来微笑)。这也将减少人为错误和资源需求。
  • 最后一个问题的答案完全取决于您的云部署。您应该尝试使用 2 个分片 2 个副本配置,然后创建测试部署以确保其满足您的需求。如果不能,请尝试使用分片和副本数量的不同组合,直到你得到你想要的(我知道它的痛苦!)。

最后不要忘记估计您 future 的增长( future 几年您将向集群添加多少数据),并记住您应该决定分片和副本

关于SolrCloud 与 Solr 主从复制,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15975093/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com