gpt4 book ai didi

algorithm - 如何使倒排索引搜索更快?

转载 作者:塔克拉玛干 更新时间:2023-11-03 02:53:11 24 4
gpt4 key购买 nike

我正在设计一个全文搜索引擎的架构。其中一点是在响应时间很少的大型数据集之间处理查询。我能弄清楚的一件事是将倒排索引拆分为多个分区。有两种策略:基于术语的分区和基于文档的分区。但我真的很想知道是否有任何其他方法可以在大型数据集中更快地进行反向搜索?

最佳答案

video是与 ElasticSearch 的开发者 Shay Banon 的演讲分布式全文搜索引擎。在视频中,他讨论了基于术语的分区和基于文档的分区的优缺点。

基本上,基于术语的分区会在进程/节点之间产生过多的网络带宽。而且很难很好地实现。基于文档的实现和产生结果极其简单。

此外,in this lecture by Jeffrey Dean他还解释了差异,并说 Google 使用基于文档的分区。

这是分发搜索引擎的两种主要方式。我不知道其他方法。无论如何,您可能想要搜索信息检索文献以查找有关该主题的新作品。

关于algorithm - 如何使倒排索引搜索更快?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9014359/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com