gpt4 book ai didi

configuration - 我应该如何配置我的 Solr filterCache、firstSearcher 和 newSearcher?

转载 作者:行者123 更新时间:2023-12-03 17:33:58 25 4
gpt4 key购买 nike

问题 1:我正在尝试优化 solrconfig.xml 中的搜索器,但有两种不同的搜索器可以升温。我的理解是 firstSearcher 只在服务器启动时触发。每当您需要新搜索器时,就会创建一个 newSearcher。在我看来,我们希望在每个中指定相同的 fqs 和 facet。什么时候您希望它们有所不同?

问题 2:有什么方法可以确定添加 fq 或 facet 对搜索器启动时间的影响吗?我知道我可以用 fqs/facets 与没有 fqs/facets 的搜索器蛮力测量启动时间,但这不是很细粒度。假设单个 fq/facet 的方式有成本/ yield ,我希望能够对其进行衡量,以便我可以决定哪些事情值得加热,哪些不值得。

问题 3:如何有效地调整 filterCache 的大小?我有一组特定的 fq,我知道它可能会被命中,大约有 500 个,所以我似乎会将其设置为 500。但是,Solr 似乎使用 filterCache 来处理必须分面的查询结果。由于我 90% 的查询都是分面的,因此我们似乎必须使用预期的查询数量作为缓存大小的基础。听起来对吗?

最佳答案

  • 你的理解是正确的。然而,一个 newSearcher 可以从上一个自动预热,所以这是一个区别。另一个原因是因为 newSearcher 每次提交都会发生,如果你经常提交,你可能想要做的工作比冷开始时少得多。
  • 我不知道有什么好方法。查询是连续运行的,至少使用 firstSearcher 会显示在访问日志中,因此您可以从字面上看到它们需要多长时间。给定的查询集是否会导致“足够温暖”的结果几乎是反复试验。
  • 关于 FilterCache 大小要记住的最重要的事情是单个条目约为(索引中的文档数)/8 个字节。因此,如果您将大小设置为 500,并且您的索引中有 100M 文档,那么您将需要 6.25G 的堆来容纳它。通常建议您将堆的大小尽可能小,以便为磁盘缓存留出更多内存,但这是一个异常(exception)。就对缓存施加驱逐压力的方面查询而言,我遇到了同样的问题,我不知道有任何解决方案。见 https://issues.apache.org/jira/browse/SOLR-8171 .
  • 关于configuration - 我应该如何配置我的 Solr filterCache、firstSearcher 和 newSearcher?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14737897/

    25 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com