java - Groovy/Java : Parallel processing of directory structure where each node is a list of subdirectories/files-6ren

java - Groovy/Java : Parallel processing of directory structure where each node is a list of subdirectories/files

转载作者：行者123 更新时间：2023-12-01 23:48:56

25

4

这是我当前的问题:

我有一个目录结构存储在云存储中的某个位置。在 Root 文件夹下，我有 1000 多个子目录，每个子目录下都有一个子目录。在每个子目录中，都存在一个文件。所以简化图看起来像这样:

                      Root
       ________________|________________
      |         |             |         |
   FolderA   FolderB  ...  FolderY   FolderZ
      |         |             |         |
   Folder1   Folder2       Folder3   Folder4
      |         |             |         |
    FileA     FileB         FileC     FileD

对于每个节点，它都有属性type(“目录”或"file")和path(“/Root/FolderB”)。检索这些节点的唯一方法是调用名为 listDirectory(path) 的方法，该方法会转到云端，获取该 path 内的所有对象。我需要找到所有文件并处理它们。

问题是，按照它的结构方式，如果我想查找 FileA，我需要调用 listDirectory() 三次 (Root -> FolderA ->Folder1)，你可以想象它会显着减慢整个过程。

我想以并行方式处理这个问题，但我似乎无法让它工作。我尝试通过使用 GParsPool.withPool 和 eachParallel() 来递归地执行此操作，但我发现使用递归进行并行编程可能是一个危险(且昂贵)的斜坡。我尝试通过创建一个同步列表来线性地执行此操作，该列表保存每个线程访问过的目录的所有路径。但这些似乎都不起作用，也没有为这个问题提供有效的解决方案。

仅供引用，我无法更改 listDirectory() 方法。每次调用都会检索该路径中的所有对象。

TL;DR:我需要找到一种并行的方法来处理云存储文件结构，其中获取文件夹/文件的唯一方法是通过 listDirectory(path) 方法。

最佳答案

如果不能使用守护进程在内存中缓存目录结构。

或者通过最初在内存中创建存储结构的一次性映射并 Hook 到存储的每个添加删除更新操作并相应地更改数据库来缓存目录结构，这不是一种选择。

假设存储结构是树(通常是)，因为 listDirectory() 的工作方式我认为你最好使用 Breadth first search搜索存储结构树。这样您就可以使用并行编程一次搜索一个级别

您的代码可能如下所示:

SearchElement.java - 表示目录或文件

public class SearchElement {

private String path;
private String name;

public SearchElement(String path, String name) {
    this.path = path;
    this.name = name;
}

public String getPath() {
    return path;
}

public String getName() {
    return name;
}

}

ElementFinder.java - 一个类，用于搜索将 listDirectory 函数替换为实现所需的存储

import java.util.ArrayList;
import java.util.Collection;
import java.util.Optional;
import java.util.Queue;
import java.util.concurrent.ConcurrentLinkedQueue;
import java.util.concurrent.atomic.AtomicReference;

public class ElementFinder {
    private final SearchElement ROOT_DIRECTORY_PATH = new SearchElement("/", "");


    public Optional<SearchElement> find(String elementName) {
        Queue<SearchElement> currentLevelElements = new ConcurrentLinkedQueue();
        currentLevelElements.add(ROOT_DIRECTORY_PATH);

        AtomicReference<Optional<SearchElement>> wantedElement = new AtomicReference<>(Optional.empty());

        while (!currentLevelElements.isEmpty() && wantedElement.get().isEmpty()) {
            Queue<SearchElement> nextLevelElements = new ConcurrentLinkedQueue();
            currentLevelElements.parallelStream().forEach(currentSearchElement -> {
                Collection<SearchElement> subDirectoriesAndFiles = listDirectory(currentSearchElement.getPath());

                subDirectoriesAndFiles.stream()
                        .filter(searchElement -> searchElement.getName().equals(elementName))
                        .findAny()
                        .ifPresent(element -> wantedElement.set(Optional.of(element)));

                nextLevelElements.addAll(subDirectoriesAndFiles);
            });

            currentLevelElements = nextLevelElements;
        }

        return wantedElement.get();
    }

    private Collection<SearchElement> listDirectory(String path) {
        return new ArrayList<>(); // replace me!
    }
}

关于java - Groovy/Java : Parallel processing of directory structure where each node is a list of subdirectories/files，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/58226567/

25

4

0

文章推荐： java - 为什么选择 Broadleaf Commerce 而不是 Magento 或 ZenCart？

文章推荐： java - 为什么我的变量在循环中没有被改变？

文章推荐： java - 将组件分成类

文章推荐： Django，将员工从登录重定向到管理站点

groovy - 在 groovy 脚本中包含一些 groovy 脚本
我有一些库脚本:lib1.groovy: def a(){ } lib2.groovy: def b(){ } lib3.groovy: def c(){ } 并想在其他脚本中使用它们:配置文件: a
groovy - 如何将 Groovy 放在集中式 Groovy 库中并从任何脚本访问该类
我有下面的 Groovy 脚本，我需要将它放在集中式 Groovy 库中，然后从 Ready API 项目中的任何脚本访问 Groovy 中提到的类路径 : D:\GroovyLib\com\Lin
groovy - 所有 Groovy 代码都对 Groovy++ 有效吗？
看完后this link ，我想尝试Groovy++，但我有一个担心； Groovy 的所有语法在 Groovy++ 中都有效吗？例如，我可以在 Groovy 中执行此操作: def list =
groovy - Spring Boot + Groovy + logback.groovy
我在 Spring-boot 应用程序中混合了 Groovy 和 Java。休息 Controller 和数据访问是用 Groovy 编写的。配置主要使用Java。根据 logback 文档，如果类
groovy - 在另一个 groovy 中包含一个 groovy 脚本
我已阅读how to simply import a groovy file in another groovy script 我想在一个 groovy 文件中定义常用函数，并从其他 groovy 文
groovy - 是否可以将多个 groovy 类放在同一个 groovy 文件中？
你知道，我也知道，只要只有一个是公共(public)的，就可以用 Java 实现。但是，在 Groovy 中可以这样做吗？如果是的话，在什么条件下？最佳答案 Java 和 Groovy 之间在可以放
groovy - 如何在另一个 groovy 脚本中简单地导入 groovy 文件
~/groovy % tree . ├── lib │ ├── GTemplate.class │ └── GTemplate.groovy └── Simple.groovy class
groovy - 将参数复制到 Groovy 类中的属性的 Groovy 方法是什么？
给定一个具有属性和构造函数的对象，我希望将构造函数参数复制到属性中，然后在构造函数中做一些额外的工作。 import groovy.transform.TupleConstructor @TupleC
groovy - 使用 groovy 脚本输出作为另一个 groovy 脚本的输入
我会提前道歉，我是 groovy 的新手。我的问题是我有 3 个执行不同功能的 groovy 脚本，我需要从我的主 groovy 脚本中调用它们，使用脚本 1 的输出作为脚本 2 的输入和脚本 2 的
groovy - Groovy 中静态闭包的访问值
我想在静态闭包中存储一些属性，然后在方法调用期间访问它们: class Person { static someMap = { key1: "value1", key2: "value2" } }
groovy - Groovy 中的安全范围运算符？
Groovy 是否有安全范围运算符？例如，如果我有， [1,2,3][0..10] Groovy 会抛出一个 java.lang.IndexOutOfBoundsException: 有没有索引安全
groovy - Groovy 中的内联条件映射字面量
在 Groovy 中使用 Maps/JsonBuilder 处理一些翻译/映射功能。是否有可能(无需在 map 文字创建之外创建额外的代码).. 有条件地包含/排除某些键/值对？一些事情沿着以下路线
groovy - Groovy:if-then语句是否具有局部作用域？
不知道我是否正确询问，但是我有类似以下内容: def x = 1 if (x == 1) { def answer = "yes" } println answer 我收到错误
groovy - groovy 是弱类型还是强类型？
我不明白 groovy 打字是如何工作的。在 wikipedia据说它具有很强的类型，但我可以在解释器上完美地做到这一点: 1 + '1' ==> 11 所以也许我很困惑，我不明白弱类型是什么，但我想
groovy - Groovy 中的函数式样式计数器
我对函数式编程概念非常陌生，正在观看 Neil Ford 在 youtube 中的演讲。 .在那里他谈到了一个计数器来演示一段代码而不使用全局状态(在 20:04)。来自 Java 世界，我很难理解这
groovy - Groovy 中的类型类型转换
我有两个问题。我执行以下代码来查找 $ 的 ASCII 值: def a = "\$" def b = (int)a println b //prints 36 好吧，我对答案很满意。但是当我尝试像
groovy - Groovy 做值匹配的方法？
只是想知道时髦像这样与默认值进行值匹配的方法？ if(params.max != 10 && params.max != 20 && params.max != 30){ params.m
groovy - Groovy *。运营商
我最近正在读《行动中的格鲁夫》。在第7章中，它介绍了*。运算符(operator) 。当我运行有关此运算符的代码时，我会遇到一些错误。 class Invoice {
groovy - Groovy 中的真正组合
是否有易于阅读的方法或一些聪明的方法来制作 combination Groovy 中的元素？我知道 Iterable#combinations或 GroovyCollections#combinati
groovy - 安装 Groovy
最近我下载了 Groovy-2.3.6 并尝试在 Linux 系统上安装它。我按照 http://groovy-lang.org/install.html 的说明进行操作.我设置了我的 GROOVY_

首页

博学

6Ren·AI

商城

java - Groovy/Java : Parallel processing of directory structure where each node is a list of subdirectories/files