gpt4 book ai didi

ocr - 为什么 DPI 与用于 OCR 的相机拍摄的图像相关

转载 作者:行者123 更新时间:2023-12-02 03:57:24 30 4
gpt4 key购买 nike

我目前正在开发一个涉及使用 Tess4j Tesseract OCR 引擎的项目。在从事这个项目时,我发现很多网站都指出 Tesseract 在至少 300 DPI(每英寸点数)的图像上效果最佳。

我的问题是为什么图像的 DPI 被多次提及。据我了解,当您扫描一个物体时,您希望以至少 300 DPI 的分辨率进行扫描。我只是不明白为什么这与用相机拍摄的照片有关。据我所知,DPI 是打印机的一个属性。基于此属性,数值越高,图像越小,但质量越高。

现在,如果 DPI 与这些图像无关,那么我想知道为什么当我在 72 和 300 之间更改图像的 DPI 属性时,程序的结果会有所不同。是否存在我不知道的 Tesseract 预处理?

最佳答案

实际上,它是特定 DPI 下的文本大小。

Is there a Minimum Text Size? (It won't read screen text!)

There is a minimum text size for reasonable accuracy. You have to consider resolution as well as point size. Accuracy drops off below 10pt x 300dpi, rapidly below 8pt x 300dpi. A quick check is to count the pixels of the x-height of your characters. (X-height is the height of the lower case x.) At 10pt x 300dpi x-heights are typically about 20 pixels, although this can vary dramatically from font to font. Below an x-height of 10 pixels, you have very little chance of accurate results, and below about 8 pixels, most of the text will be "noise removed".

https://github.com/tesseract-ocr/tesseract/wiki/FAQ#is-there-a-minimum-text-size-it-wont-read-screen-text

关于ocr - 为什么 DPI 与用于 OCR 的相机拍摄的图像相关,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43363067/

30 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com