gpt4 book ai didi

ios - Tesseract hOCR iOS

转载 作者:行者123 更新时间:2023-12-01 16:44:11 27 4
gpt4 key购买 nike

我正在学习如何使用Tesseract API,并且对hOCR输出功能很感兴趣。目前,我正在使用此代码来扫描图像。

 Tesseract* tesseract = [[Tesseract alloc] initWithLanguage:@"eng"];
tesseract.delegate = self;
[tesseract setVariableValue:@"0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ@.-():" forKey:@"tessedit_char_whitelist"];
[tesseract setVariableValue:@"0" forKey:@"tessedit_create_hocr"];

UIImage *image = [UIImage imageNamed:@"card.jpg"];

CGFloat newWidth = 1200;
CGSize newSize = CGSizeMake(newWidth, newWidth);
image = [image resizedImage:newSize interpolationQuality:kCGInterpolationHigh];


[tesseract setImage:image]; //image to check
[tesseract recognize];

NSLog(@"Here is the text %@", [tesseract recognizedText]);

一切都可以正常编译,但是我想知道如何存储hOCR函数返回的.html。
我可以将其存储在变量中吗?生成文件后,我需要能够在程序中访问该文件。任何有关如何在iOS上使用hOCR的见解都值得赞赏。

最佳答案

如果继续执行以下操作,则会得到NSString。

- (NSString *)getHOCRText {
char *boxtext = _tesseract->GetHOCRText(0);
return [NSString stringWithUTF8String:boxtext];
}

稍后,您可以将此NSString转换为NSData。
    NSData *xmlData = [xmlString dataUsingEncoding:NSASCIIStringEncoding];

这样您就可以使用NSXMLParser解析此数据
        NSXMLParser *xmlParser = [[NSXMLParser alloc] initWithData:xmlData];

希望您了解其余的解析过程。

关于ios - Tesseract hOCR iOS,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21541830/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com