gpt4 book ai didi

ios - Tesseract OCR 不会忽略黑名单字符

转载 作者:塔克拉玛干 更新时间:2023-11-02 09:18:22 31 4
gpt4 key购买 nike

我正在使用 Tessearct OCR 识别图像的字符。但我希望 OCR 使用

忽略数字字符
_tesseract->SetVariable("tessedit_char_blacklist", "0123456789");

通过这种方式,OCR 无法识别数字字符,但它会为我提供一些其他字符来代替我不想要的字符。

例如:有一张图片的文本为 USD 12 ,当我对该图片应用 OCR 时,它会提供给我 USD fl

正如我们在上面看到的那样,OCR 将 12 转换为我不想要的 fl。我希望 OCR 忽略 12

有什么方法可以得到 USD 而不是 USD fl

的结果

为此提供任何解决方案。任何帮助都将不胜感激。

最佳答案

请参阅方法 SetVariable() 的评论:

// For most variables, it is wise to set them before calling Init.

我遇到了和你一样的问题,在 Init 修复它之前移动了代码:

tess = new TessBaseAPI();    
tess->SetVariable("tessedit_char_whitelist",
"0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz");
tess->SimpleInit([dataPath cStringUsingEncoding:NSUTF8StringEncoding],
"eng", false);

关于ios - Tesseract OCR 不会忽略黑名单字符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15199510/

31 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com