gpt4 book ai didi

performance - 我应该将 Solr 中存储字段的大小保持在最小吗?

转载 作者:行者123 更新时间:2023-12-04 22:50:30 25 4
gpt4 key购买 nike

我希望引入 Solr 来为企业列表网站的搜索提供支持。该网站有大约 200 万条记录。

有一个搜索结果页面,它将显示每个结果的一些关键数据。我相信此摘要信息所需的数据约为每个结果 1KB。

我可以简单地索引 Solr 中搜索所需的字段 - 但这意味着每个结果都有一个单独的数据库调用来填充摘要信息。如果 Solr 可以返回所有这些数据,我希望它产生比大约 40 次数据库往返更高的性能。

令人担忧的是,Solr 的内存使用量会太大(我该如何计算?)并且索引可能会因额外数据而花费太长时间。

最佳答案

与 40 db 往返相比,将这些字段存储在 Solr 中会受益匪浅。只需确保您在架构配置中将该字段标记为“未索引”(索引 = 假),并且可能还被压缩(压缩 = 真)(但是,这当然会在索引和检索时使用一些 CPU)。

当将字段标记为“未索引”时,没有分析器会在索引时处理该字段,使其存储速度比索引字段快得多。

关于performance - 我应该将 Solr 中存储字段的大小保持在最小吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6911073/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com