gpt4 book ai didi

java - 优化 Java Scanner 以更快地匹配文件中的正则表达式

转载 作者:行者123 更新时间:2023-11-30 08:03:55 24 4
gpt4 key购买 nike

我目前正在使用此代码来将正则表达式与许多文件进行匹配,但是,这相当慢。有没有办法可以做同样的事情,但速度更快?

public class Filter {
private String title;
private String regex;
private List<String> results = new LinkedList<String>();
...
}

我有一些针对不同类型正则表达式的过滤器,它们的范围从匹配电子邮件到匹配单词(如 apikey),...该代码将用于扫描反编译类和其他基于文本的文件中的漏洞。

我的代码也只检查文件中的 1 个匹配项,我想获取所有匹配项。

public void startScans() {
List<File> files = getAllFiles(getFolder()); //Gets a list of all text based files in a folder
for (int i = 0; i < files.size(); i++) {
for(Filter filter : getFilters()) {
try {
System.out.print("\rScanning file " + i + " out of " + files.size() + " using filter " + filter.getTitle() + "...");
scanFile(files.get(i), filter);
} catch (FileNotFoundException ignored) {}
}
}
}

private void scanFile(File f, Filter filter) throws FileNotFoundException {
Scanner scanner = new Scanner(f);
String result = scanner.findWithinHorizon(filter.getRegex(), 0);
if (result != null) {
filter.addResult(result);
}
scanner.close();
}

最佳答案

如果想要更快的执行速度,也可以使用外部工具,即执行命令。例如

  • Windows:findstr/R [a-z]*xyz *

  • Linux:egrep -R "[a-z]*xyz".

注意:您可以从 Java 运行这些命令。

关于java - 优化 Java Scanner 以更快地匹配文件中的正则表达式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31452038/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com