gpt4 book ai didi

c# - 优化 Lucene 批量索引

转载 作者:行者123 更新时间:2023-11-30 22:43:10 24 4
gpt4 key购买 nike

问题是:

我使用的是 Lucene.Net,我导入了约 255k 个文档,每个文档约有 6 个字段。我尝试了一些东西,但这个过程需要很多时间(~1 天)。我没有使用任何奇怪的分析器,只是使用标准分析器,我只对其中一个字段进行标记。我尝试更改最大合并文档,但什么也没有。

有人遇到过这个问题吗?

谢谢和最好的问候

最佳答案

我会采取不同的选择,我决定发布结果,所以如果有人遇到同样的问题,可能会找到其他方法。

Lucene.net 有一个有趣的功能,允许合并两个索引,所以我的想法是将我的内容索引到几个较小的索引中,并使用合并功能将它们连接起来。

这对我有用。我测试了这个索引 WordNet 的解决方案以对其执行查询并且它完美地工作。

关于c# - 优化 Lucene 批量索引,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4081607/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com