gpt4 book ai didi

java - Lucene 索引历史记录/最后一个索引文件

转载 作者:行者123 更新时间:2023-12-02 05:41:15 25 4
gpt4 key购买 nike

有没有办法找到在 Lucene 索引中输入的最后一个 Lucene 文档?例如。 Lucene 是否以某种方式跟踪历史记录,或者我可以以某种方式提取已添加到索引中的文件(文档)的顺序吗?

背景:我想构建一个包含数百万文档的非常大的索引,需要几天的时间才能运行。我希望有一个索引实现来检测最后添加的文件是什么,并在再次重新启动时继续在此位置。

最佳答案

不完全是,不。最接近的是从索引中获取最高的文档 ID。如果您刚刚开始将文档添加到空索引,并且没有删除或更新任何内容,那么它甚至可能有效。但不能保证文档 ID 按顺序分配。

如果您需要知道文档的添加顺序。您应该添加一个处理该问题的字段。存储索引时间的日期/时间或顺序 ID 都可以很好地发挥作用。尽管听起来有点太过分了,但您只需要存储一个标识符来标识要恢复的源文档。在这种情况下,请将该 ID 存储在任何位置。在lucene中,在数据库中,在txt文件中,序列化的字符串。只要能让你开心就好。

关于java - Lucene 索引历史记录/最后一个索引文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24494968/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com