gpt4 book ai didi

android - 文字识别。使用tesseract识别里程表

转载 作者:塔克拉玛干 更新时间:2023-11-02 09:24:14 26 4
gpt4 key购买 nike

我想识别里程表中的数字。我找到了这个适用于 iOS 的教程。 https://www.raywenderlich.com/93276/implementing-tesseract-ocr-ios

我的 tesseract 属性:

func performImageRecognition(image: UIImage) {

let tesseract = G8Tesseract()
tesseract.language = "eng"
tesseract.engineMode = .TesseractCubeCombined
tesseract.pageSegmentationMode = .Auto
tesseract.maximumRecognitionTime = 60.0
tesseract.setVariableValue("0123456789", forKey: "tessedit_char_whitelist")
tesseract.image = image.g8_blackAndWhite()
tesseract.recognize()
}

应用程序成功识别标准文本。但应用程序无法识别里程表中的数字。是否可以采用超正方体来扫描里程表?

我试过这张图片: enter image description here enter image description here enter image description here

最佳答案

如果我是你,我会尝试从里程表图像中剪下数字,拉直它们,做阈值(手动操作)并查看 tesseract 是否正确扫描处理过的图像,结果有多清晰。如果它确实正确扫描,您应该使算法以编程方式处理图像(使用 openCV 可能是最好的)。如果它没有,您应该尝试针对这些数字训练您的 tesseract,这在里程表上很常见,然后看看 tesseract 是如何工作的(我个人没有尝试过训练,也许 this 会有所帮助)。

enter image description here

你的图像应该是这样的,但问题是,例如,最后一个数字肯定不会被识别为 1,即使你将 tesseract 字符白名单减少到“0123456789”,它也会被扫描为 1和 1(因为有两个部分)。如果您想使用 tesseract,我认为 tesseract 培训在您的情况下是强制性的。顺便说一下,你前两张图片的情况应该会好一些。

关于android - 文字识别。使用tesseract识别里程表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36676178/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com