gpt4 book ai didi

search - Lucene中同一存储位置上的多个索引器

转载 作者:行者123 更新时间:2023-12-02 22:47:20 26 4
gpt4 key购买 nike

我想构建一个高度可扩展的应用程序,并打算将Lucene用作我的搜索引擎库。在浏览文档和常见问题时,我意识到通过在索引目录中创建一些write.lock,它只允许在存储位置打开一个索引编写器。我们可以在该索引上打开多个IndexReader。

我对建立一个体系结构感兴趣,在该体系结构中,有许多索引器运行在不同的机器/服务器上,并且多个搜索器在这些索引器创建的索引上回答各种类型的查询。搜索器和索引器都将在不同的计算机上运行。

在这种情况下,最好让多个索引器使用相同的索引存储位置来索引文档。如何实现呢?我应该使用NFS(网络文件系统)之类的东西吗? Solr或Lucene之上的其他框架是否已解决了此问题?我想到的一个显而易见的解决方案是为每个索引器创建一个索引,然后要求搜索者跨多个索引目录进行查询。但是,这些将导致创建大量不同的索引目录,与创建索引服务器的数量一样多,我猜这不是很理想。我想要(索引目录数)<<(索引器数)<(搜索者数)

在这种情况下,我有哪些其他选择?

最佳答案

首先:切勿将NFS与Lucene一起使用,因为它速度慢且危险。

如果涉及到可扩展性和高可用性,我建议您让Elasticsearch为您完成所有艰苦的工作,以便您可以专注于数据。您当然可以有多个线程为数据建立索引。

如果您想进一步了解elasticsearch的分布式性质,建议您看看this video

关于search - Lucene中同一存储位置上的多个索引器,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12179069/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com