gpt4 book ai didi

python - Tesseract 无法读取这串极其简单的数字

转载 作者:太空宇宙 更新时间:2023-11-03 15:17:18 24 4
gpt4 key购买 nike

我目前正在用 python 编写脚本,需要使用 tesseract 来读取这样的数字:

enter image description here

仅使用数字和 -psm 6(或 7)输出 5.551

我在其他数字(5.700 个作品)上取得了一些成功,但这个特定数字给我带来了很多问题。不幸的是,我的程序需要高度的准确性,但我认为 tesseract 能够破译这样一个简单的字符串。

我也尝试过使用 GOCR,它正确读取了 6.881(耶!)但是输出 5._00 为 5.700(嘘!)

知道为什么要这样做吗?

或者更重要的是,我可以做任何事情来解决这个问题(最好是不必训练 tesseract)。

最佳答案

我将其大小加倍并使用 Imagemagick(您可以根据需要使用其他东西)去除透明度(用白色代替),然后 Tesseract OCR 正确地增强了图像:

$ convert I1Zau.png -background white -flatten -resize 200% I1Zau_2.png
$ tesseract I1Zau_2.png o.txt
$ cat o.txt.txt
6.881

关于python - Tesseract 无法读取这串极其简单的数字,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19951598/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com