gpt4 book ai didi

lucene - 如何修复损坏的lucene索引?

转载 作者:行者123 更新时间:2023-12-04 01:07:38 25 4
gpt4 key购买 nike

我的服务器断电,lucene 索引损坏。我运行了 IndexChecker 但它失败了:

java -cp /home/dthoai/programs/paesia/checker/lucene-core-3.5.0.jar -ea:org.apache.lucene... org.apache.lucene.index.CheckIndex /mnt/peda/paesia/index -fix


Opening index @ /mnt/peda/paesia/index

ERROR: could not read any segments file in directory
java.io.IOException: read past EOF: MMapIndexInput(path="/mnt/peda/paesia/index/segments_ls0l")
at org.apache.lucene.store.MMapDirectory$MMapIndexInput.readByte(MMapDirectory.java:279)
at org.apache.lucene.store.ChecksumIndexInput.readByte(ChecksumIndexInput.java:41)
at org.apache.lucene.store.DataInput.readInt(DataInput.java:84)
at org.apache.lucene.store.DataInput.readLong(DataInput.java:126)
at org.apache.lucene.index.SegmentInfo.<init>(SegmentInfo.java:202)
at org.apache.lucene.index.SegmentInfos.read(SegmentInfos.java:286)
at org.apache.lucene.index.SegmentInfos$1.doBody(SegmentInfos.java:363)
at org.apache.lucene.index.SegmentInfos$FindSegmentsFile.run(SegmentInfos.java:754)
at org.apache.lucene.index.SegmentInfos$FindSegmentsFile.run(SegmentInfos.java:593)
at org.apache.lucene.index.SegmentInfos.read(SegmentInfos.java:359)
at org.apache.lucene.index.CheckIndex.checkIndex(CheckIndex.java:327)
at org.apache.lucene.index.CheckIndex.main(CheckIndex.java:1007)

如何修复我的 lucene 索引?

最佳答案

它看起来像主目录文件,segments_N已损坏。这可能意味着在提交运行时发生断电。

如果是这种情况,这意味着您的目录中可能存在较旧的 segment_N 文件,并且引用的段仍然存在且有效。如果有这样的文件,请尝试删除您损坏的 segments_ls0l文件并查看:

  • Lucene 是否设法打开索引,
  • 你缺少什么数据。

  • 否则,Lucene 用户邮件列表中有一些线程在谈论重新生成 segment_N 文件。
  • http://www.gossamer-threads.com/lists/lucene/java-user/102493
  • http://www.gossamer-threads.com/lists/lucene/java-user/39744

  • 在执行任何修改之前,请确保备份您的目录。

    关于lucene - 如何修复损坏的lucene索引?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9935177/

    25 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com