gpt4 book ai didi

java - 扫描包含变量名称的文件

转载 作者:行者123 更新时间:2023-12-02 03:26:02 25 4
gpt4 key购买 nike

我有一段简单的代码,当前使用 tesseract OCR 来读取任何给定图像中的文本,然后计算它生成的行数。但是,我想在目录中搜索包含字符串(例如 M000123456)的任何文档,并返回名称中包含该字符串的文档数量,并将其与正方体输出的数量进行比较。这些文档的命名如下:M000123456_V987654_05-07-2000.pdf。最好的方法是什么?

import java.io.File;

import net.sourceforge.tess4j.Tesseract;
import net.sourceforge.tess4j.TesseractException;

public class Main {
public static void main(String[] args) throws TesseractException {
Tesseract tesseract = new Tesseract();

tesseract.setDatapath("C:\\Users\\mmx0409\\Downloads\\Tess4J-3.4.8-src\\Tess4J\\tessdata");

// the path of your tess data folder
// inside the extracted file
String text
= tesseract.doOCR(new File("C:\\Users\\mmx0409\\Downloads\\testimage.png"));

// path of your image file
System.out.print(text);
System.out.println(text.lines().count()); // count the number of lines tesseract saw

}
}

最佳答案

您可以使用下面的函数来统计名称中包含 searchString 的文档的数量。

public int countDocuments(String directoryPath, String searchString) {
File folder = new File(directoryPath);

File[] listOfFiles = folder.listFiles();

int count = 0;

for (int i = 0; i < listOfFiles.length; i++) {
if (listOfFiles[i].isFile()) {
String fileName = listOfFiles[i].getName();
if (fileName.contains(searchString)) {
count++;
}
}
}

return count;
}

关于java - 扫描包含变量名称的文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56907296/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com