gpt4 book ai didi

unit-testing - Lucene 索引的单元测试

转载 作者:行者123 更新时间:2023-12-04 06:50:56 24 4
gpt4 key购买 nike

我正在处理在另一个索引中构建流行术语索引的遗留代码。没有适当的单元测试,而且索引过程是一个痛苦的等待,因为第一个索引需要很长时间来构建。

我想以不同的方式构建第二个(流行术语)索引。是否有测试 Lucene 索引是否正确创建的最佳实践?

编辑>> 根据@Pascal 的建议,我使用的是 RAMDirectory,然后为了测试我刚刚编写的索引,我设置了一个 indexReader 并遍历术语结果,打印出每个术语以确保数据看起来没问题。

代码:

IndexReader reader = IndexReader.open(dir2);
TermEnum terms = reader.terms();
System.out.println("Here come the terms!");
while (terms.next()){
if (terms.term().field().equals("FULLTEXT")){
System.out.println(terms.term());
}
}
int numDocs = reader.maxDoc();
System.out.println("Number of Docs: " + numDocs);

如果索引真的很大,我让它运行一下,然后在中途停止它。

另外, Luke如果您想更彻底地检查索引,这是一个很好的工具......我只是在寻找快速的东西。

欢迎任何其他想法!

最佳答案

在对 Lucene 索引进行单元测试时,我经常使用 RAMDirectory,因为它可以快速构建。

关于unit-testing - Lucene 索引的单元测试,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3143417/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com