gpt4 book ai didi

java - 有什么办法可以显着提高这个文件搜索的效率吗?

转载 作者:行者123 更新时间:2023-12-01 14:53:58 25 4
gpt4 key购买 nike

此方法使用递归来查找名称中包含特定字符串的文件。它在网络驱动器上搜索,有时必须搜索数百甚至数千个目录才能找到所需内容。它相当慢——有时需要 5-10 秒。我怀疑延迟是由网络连接引起的,因为该网络对于其他一切来说都非常快。不管怎样,这只是我想出来的东西,所以可能有更有效的东西。

public static File findFile(File root, String name)
{
File [] dir = root.listFiles();
File a = null;

for(int i = 0; i < dir.length; i++)
{
if(dir[i].isDirectory() && a == null)
a = findFile(dir[i],name);
else if(dir[i].getName().indexOf(name) > -1)
return dir[i];
}

return a;
}

那么有什么办法可以改善这个问题吗?或者搜索这么多目录的过程总是那么慢?谢谢。

最佳答案

这可能有点过头了,但请考虑构建一个 index

我个人使用过Apache Lucene过去需要索引各种 Web 资源,包括图像文件、PDF、html 等。使用 Lucene 4.1,添加索引以及搜索索引变得非常简单。

将文件夹(及其所有子文件夹)添加到索引

首先,将网络驱动器中的所有内容添加到索引中非常简单:

java org.apache.lucene.demo.IndexFiles -docs {path-to-folder}

搜索索引

将所有必需的文件添加到索引后,您可以使用 Lucene 库提供的搜索索引器来搜索文档:

IndexSearcher.search(query, n)

配置有无限的可能性,您也不仅限于搜索文件名。

关于java - 有什么办法可以显着提高这个文件搜索的效率吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14489170/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com