gpt4 book ai didi

java - 如何在java中将文本区域与图像分开

转载 作者:行者123 更新时间:2023-11-30 07:58:42 27 4
gpt4 key购买 nike

我正在使用 OCR 来识别护照详细信息,因为我使用的是 Tesseract Java API。为了获得更高的准确性,我需要将整个图像(可以是 .png、.jpeg、.tiff)仅划分为文本区域。是否有任何开源 java 库可以将文本区域与图像分开。请给我任何建议。

最佳答案

Marvin正是为此目的提供了一种方法。

public static java.util.List<MarvinSegment> findTextRegions(MarvinImage imageIn,
int maxWhiteSpace,
int maxFontLineWidth,
int minTextWidth,
int grayScaleThreshold)

输入图片:

enter image description here

输出图像:

enter image description here

源代码:

import static marvin.MarvinPluginCollection.*;

public class TextRegions{

public static void main(String[] args) {

MarvinImage image = MarvinImageIO.loadImage("./res/passport.png");
MarvinImage originalImage = image.clone();
List<MarvinSegment> segments = findTextRegions(image, 15, 8, 30, 150);

for(MarvinSegment s:segments){
if(s.height >= 5){
originalImage.drawRect(s.x1, s.y1, s.x2-s.x1, s.y2-s.y1, Color.red);
}
}

MarvinImageIO.saveImage(originalImage, "./res/passport_2.png");
}
}

关于java - 如何在java中将文本区域与图像分开,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40236472/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com