gpt4 book ai didi

java - Tess4j - Pdf 到 Tiff 到超正方 - "Warning: Invalid resolution 0 dpi. Using 70 instead."

转载 作者:行者123 更新时间:2023-12-02 09:26:51 26 4
gpt4 key购买 nike

我正在使用 tess4j (net.sourceforge.tess4j:tess4j:4.4.0) 并尝试对 pdf 文件进行 OCR。因此,据我了解,我必须首先将 pdf 转换为 tiff 或 png(其中有建议的吗?)我是这样做的:

tesseract.doOCR(PdfUtilities.convertPdf2Tiff(inputPdfFile)); 

并收到以下警告:

Warning: Invalid resolution 0 dpi. Using 70 instead.

问题

  • 它对我的扫描结果有影响吗? (如果没有,好的 - 我可以 switch off 警告)
  • 有没有办法手动设置 DPI,或者应该 convertPdf 帮我处理这个问题?

最佳答案

如果图像元数据中没有分辨率信息,Tesseract 会尝试自行估计分辨率,以便可以在结果中计算字体大小信息。

您可以尝试以下API来设置输入图像分辨率:

instance.setVariable("user_define_dpi", "300");

TessBaseAPISetSourceResolution(TessBaseAPI 句柄,int ppi);

您可以通过以下方式抑制控制台输出:

instance.setVariable("debug_file", "/dev/null");

关于java - Tess4j - Pdf 到 Tiff 到超正方 - "Warning: Invalid resolution 0 dpi. Using 70 instead.",我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58286373/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com