gpt4 book ai didi

solr - 单核或多核 Solr

转载 作者:行者123 更新时间:2023-12-05 00:37:54 29 4
gpt4 key购买 nike

我们计划部署 Solr 来搜索从通用 CMS 平台发布的多个站点。

每种语言都有单独的网站,其他语言的内容主要是从英语翻译过来的。

搜索要求包括 – 关键字突出显示、建议(“你是什么意思?”)、停用词、分面。

我们正在评估使用单核与每语言多核 Solr 选项。这里推荐的方法是什么?

最佳答案

您需要多核,因为您无法在多语言数据库上进行词干提取和停用词。

英语中常见的停用词是“by”和“is”,但这些词在许多北欧语言中的意思是“城镇”和“冰”。

如果您使用多核,则每种语言都可以在其自己的核心上使用自定义的 schema.xml 来选择正确的词干提取器、停用词和 protected 词。但是同一个 JVM 在同一个服务器上运行它,所以你不需要为一种特定语言的服务器花费任何额外的钱。然后,如果负载对于一台服务器来说太大,您可以复制多核设置,所有索引都将从副本中受益。

关于solr - 单核或多核 Solr,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6439019/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com