- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
这是我当前的问题:
我有一个目录结构存储在云存储中的某个位置。在 Root 文件夹下,我有 1000 多个子目录,每个子目录下都有一个子目录。在每个子目录中,都存在一个文件。所以简化图看起来像这样:
Root
________________|________________
| | | |
FolderA FolderB ... FolderY FolderZ
| | | |
Folder1 Folder2 Folder3 Folder4
| | | |
FileA FileB FileC FileD
对于每个节点,它都有属性type
(“目录”或"file")和path
(“/Root/FolderB”)。检索这些节点的唯一方法是调用名为 listDirectory(path)
的方法,该方法会转到云端,获取该 path
内的所有对象。我需要找到所有文件并处理它们。
问题是,按照它的结构方式,如果我想查找 FileA,我需要调用 listDirectory()
三次 (Root -> FolderA ->Folder1),你可以想象它会显着减慢整个过程。
我想以并行方式处理这个问题,但我似乎无法让它工作。我尝试通过使用 GParsPool.withPool
和 eachParallel()
来递归地执行此操作,但我发现使用递归进行并行编程可能是一个危险(且昂贵)的斜坡。我尝试通过创建一个同步列表来线性地执行此操作,该列表保存每个线程访问过的目录的所有路径。但这些似乎都不起作用,也没有为这个问题提供有效的解决方案。
仅供引用,我无法更改 listDirectory()
方法。每次调用都会检索该路径中的所有对象。
TL;DR:我需要找到一种并行的方法来处理云存储文件结构,其中获取文件夹/文件的唯一方法是通过 listDirectory(path)
方法。
最佳答案
如果不能使用守护进程在内存中缓存目录结构。
或者通过最初在内存中创建存储结构的一次性映射并 Hook 到存储的每个添加删除更新操作并相应地更改数据库来缓存目录结构,这不是一种选择。
假设存储结构是树(通常是),因为 listDirectory()
的工作方式我认为你最好使用 Breadth first search搜索存储结构树。这样您就可以使用并行编程一次搜索一个级别
您的代码可能如下所示:
SearchElement.java - 表示目录或文件
public class SearchElement {
private String path;
private String name;
public SearchElement(String path, String name) {
this.path = path;
this.name = name;
}
public String getPath() {
return path;
}
public String getName() {
return name;
}
}
ElementFinder.java - 一个类,用于搜索将 listDirectory 函数替换为实现所需的存储
import java.util.ArrayList;
import java.util.Collection;
import java.util.Optional;
import java.util.Queue;
import java.util.concurrent.ConcurrentLinkedQueue;
import java.util.concurrent.atomic.AtomicReference;
public class ElementFinder {
private final SearchElement ROOT_DIRECTORY_PATH = new SearchElement("/", "");
public Optional<SearchElement> find(String elementName) {
Queue<SearchElement> currentLevelElements = new ConcurrentLinkedQueue();
currentLevelElements.add(ROOT_DIRECTORY_PATH);
AtomicReference<Optional<SearchElement>> wantedElement = new AtomicReference<>(Optional.empty());
while (!currentLevelElements.isEmpty() && wantedElement.get().isEmpty()) {
Queue<SearchElement> nextLevelElements = new ConcurrentLinkedQueue();
currentLevelElements.parallelStream().forEach(currentSearchElement -> {
Collection<SearchElement> subDirectoriesAndFiles = listDirectory(currentSearchElement.getPath());
subDirectoriesAndFiles.stream()
.filter(searchElement -> searchElement.getName().equals(elementName))
.findAny()
.ifPresent(element -> wantedElement.set(Optional.of(element)));
nextLevelElements.addAll(subDirectoriesAndFiles);
});
currentLevelElements = nextLevelElements;
}
return wantedElement.get();
}
private Collection<SearchElement> listDirectory(String path) {
return new ArrayList<>(); // replace me!
}
}
关于java - Groovy/Java : Parallel processing of directory structure where each node is a list of subdirectories/files,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58226567/
我有一些库脚本:lib1.groovy: def a(){ } lib2.groovy: def b(){ } lib3.groovy: def c(){ } 并想在其他脚本中使用它们:配置文件: a
我有下面的 Groovy 脚本,我需要将它放在集中式 Groovy 库中,然后从 Ready API 项目中的任何脚本访问 Groovy 中提到的类 路径 : D:\GroovyLib\com\Lin
看完后this link ,我想尝试Groovy++,但我有一个担心; Groovy 的所有语法在 Groovy++ 中都有效吗? 例如,我可以在 Groovy 中执行此操作: def list =
我在 Spring-boot 应用程序中混合了 Groovy 和 Java。休息 Controller 和数据访问是用 Groovy 编写的。配置主要使用Java。 根据 logback 文档,如果类
我已阅读how to simply import a groovy file in another groovy script 我想在一个 groovy 文件中定义常用函数,并从其他 groovy 文
你知道,我也知道,只要只有一个是公共(public)的,就可以用 Java 实现。但是,在 Groovy 中可以这样做吗?如果是的话,在什么条件下? 最佳答案 Java 和 Groovy 之间在可以放
~/groovy % tree . ├── lib │ ├── GTemplate.class │ └── GTemplate.groovy └── Simple.groovy class
给定一个具有属性和构造函数的对象,我希望将构造函数参数复制到属性中,然后在构造函数中做一些额外的工作。 import groovy.transform.TupleConstructor @TupleC
我会提前道歉,我是 groovy 的新手。我的问题是我有 3 个执行不同功能的 groovy 脚本,我需要从我的主 groovy 脚本中调用它们,使用脚本 1 的输出作为脚本 2 的输入和脚本 2 的
我想在静态闭包中存储一些属性,然后在方法调用期间访问它们: class Person { static someMap = { key1: "value1", key2: "value2" } }
Groovy 是否有安全范围运算符? 例如,如果我有, [1,2,3][0..10] Groovy 会抛出一个 java.lang.IndexOutOfBoundsException: 有没有索引安全
在 Groovy 中使用 Maps/JsonBuilder 处理一些翻译/映射功能。 是否有可能(无需在 map 文字创建之外创建额外的代码).. 有条件地包含/排除某些键/值对?一些事情沿着以下路线
不知道我是否正确询问,但是我有类似以下内容: def x = 1 if (x == 1) { def answer = "yes" } println answer 我收到错误
我不明白 groovy 打字是如何工作的。在 wikipedia据说它具有很强的类型,但我可以在解释器上完美地做到这一点: 1 + '1' ==> 11 所以也许我很困惑,我不明白弱类型是什么,但我想
我对函数式编程概念非常陌生,正在观看 Neil Ford 在 youtube 中的演讲。 .在那里他谈到了一个计数器来演示一段代码而不使用全局状态(在 20:04)。来自 Java 世界,我很难理解这
我有两个问题。 我执行以下代码来查找 $ 的 ASCII 值: def a = "\$" def b = (int)a println b //prints 36 好吧,我对答案很满意。但是当我尝试像
只是想知道 时髦 像这样与默认值进行值匹配的方法? if(params.max != 10 && params.max != 20 && params.max != 30){ params.m
我最近正在读《行动中的格鲁夫》。在第7章中,它介绍了*。运算符(operator) 。当我运行有关此运算符的代码时,我会遇到一些错误。 class Invoice {
是否有易于阅读的方法或一些聪明的方法来制作 combination Groovy 中的元素?我知道 Iterable#combinations或 GroovyCollections#combinati
最近我下载了 Groovy-2.3.6 并尝试在 Linux 系统上安装它。我按照 http://groovy-lang.org/install.html 的说明进行操作.我设置了我的 GROOVY_
我是一名优秀的程序员,十分优秀!