gpt4 book ai didi

java - 将文档添加到索引后忘记关闭 Lucene IndexWriter

转载 作者:搜寻专家 更新时间:2023-11-01 03:13:02 24 4
gpt4 key购买 nike

我有一个程序运行了 2 天,为大约 1.6 亿个文本文件建立了一个 Lucene 索引,程序结束后,我尝试搜索索引,发现索引没有正确建立,indexReader.numDocs() 返回 0 .我检查了索引目录,看起来不错,所有索引数据似乎都在那里,目录大小为1.5 GB。

我检查了我的代码,发现我忘记调用 indexWriter.optimize() 和 indexWriter.close(),我想知道是否可以重新优化() 索引所以我不需要重建整个索引从头开始?我真的不希望该程序再花 2 天时间。

最佳答案

调用 IndexWriter.optimize() 不是必需的,可以在稍后通过重新打开索引调用。它只是优化索引中的文档以获得更好的读取性能,并且不会影响任何其他内容。

但是,如果您忘记调用 IndexWriter.close(),那么您的索引可能不完整。由于您处理了如此多的文档,它可能会刷新其中的大部分文档,因此希望您只需要重新索引最后一个文档。使用 Luke按照 UI 的建议快速浏览索引以查看其所处的状态。

关于java - 将文档添加到索引后忘记关闭 Lucene IndexWriter,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5374419/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com