gpt4 book ai didi

image - Tesseract-OCR (3.02) 识别准确率和速度

转载 作者:行者123 更新时间:2023-12-04 20:34:39 25 4
gpt4 key购买 nike

我有一组非常小的图像(w:70-100;h:12-20),如下所示:enter image description here

在这些图像中,只有小组成员的昵称。我想从简单的图像中读取文本,它们都有一个背景,只有昵称不同。所以,我对那个图像做了什么:enter image description here
我正在使用下面的代码从第二张图片中获取文本:


tesseract::TessBaseAPI ocr;
ocr.Init(NULL, "eng");
PIX* pix = pixRead("D:\\image.png");
ocr.SetImage(pix);
std::string result = ocr.GetUTF8Text();



我有两个问题:
  • ocr.GetUTF8Text();工作缓慢:650-750ms。图像很小,为什么它可以运行这么长时间?
  • 从上面的图像中,我得到了类似的结果:“iwillkillsm”、“iwillkillsel”等。那个图像很简单,我相信 tesseract 大师能够以 100% 的准确度识别它。
    我应该如何处理图像/代码,或者我应该阅读(以及在哪里)关于 tesseract-ocr(关于文本速度和质量识别的内容)来解决这些问题?
  • 最佳答案

    这听起来可能很奇怪,但是当我增加图像的尺寸时,我总是对 tesseract 有最好的运气。图像对我来说看起来“更糟”,但 tesseract 速度更快,准确度更高。

    但是,在开始变得更糟的结果之前,您可以制作多大的图像是有限的:) 我想我记得过去拍摄 600 像素。不过,你必须玩它。

    关于image - Tesseract-OCR (3.02) 识别准确率和速度,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38156961/

    25 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com