- Java 双重比较
- java - 比较器与 Apache BeanComparator
- Objective-C 完成 block 导致额外的方法调用?
- database - RESTful URI 是否应该公开数据库主键?
我使用本教程让 Tesseract OCR 与 Swift 一起工作:http://www.piterwilson.com/blog/2014/10/18/minimal-tesseact-ocr-setup-in-swift/
如果我上传演示图像并调用它就可以正常工作
tesseract.image = UIImage(named: "image_sample.jpg");
但是如果我使用我的相机代码并拍摄相同图像的照片并调用
tesseract.image = self.image.blackAndWhite();
结果要么像乱码
s I 5E251 :Ec‘-。 —7.//:E*髧g :_{:7 IC‘J 7 iii—1553‘: 嘶嘶作响——‘;-——:
; ~:~./: -:-‘-
'-:~£:': _-'~':
:37%; §:‘—_
:::::E 7,;.1f:,:~ ——,
或者返回 BAD_EXC_ACCESS 错误。我无法重现它给出错误或乱码的原因。这是我的相机捕获代码 (photo taken()) 和处理步骤 (nextStepTapped()):
@IBAction func photoTaken(sender: UIButton) {
var videoConnection = stillImageOutput.connectionWithMediaType(AVMediaTypeVideo)
if videoConnection != nil {
// Show next step button
self.view.bringSubviewToFront(self.nextStep)
self.nextStep.hidden = false
// Secure image
stillImageOutput.captureStillImageAsynchronouslyFromConnection(videoConnection) {
(imageDataSampleBuffer, error) -> Void in
var imageData = AVCaptureStillImageOutput.jpegStillImageNSDataRepresentation(imageDataSampleBuffer)
self.image = UIImage(data: imageData)
//var dataProvider = CGDataProviderCreateWithCFData(imageData)
//var cgImageRef = CGImageCreateWithJPEGDataProvider(dataProvider, nil, true, kCGRenderingIntentDefault)
//self.image = UIImage(CGImage: cgImageRef, scale: 1.0, orientation: UIImageOrientation.Right)
}
// Freeze camera preview
captureSession.stopRunning()
}
}
@IBAction func nextStepTapped(sender: UIButton) {
// Save to camera roll & proceeed
//UIImageWriteToSavedPhotosAlbum(self.image.blackAndWhite(), nil, nil, nil)
//UIImageWriteToSavedPhotosAlbum(self.image, nil, nil, nil)
// OCR
var tesseract:Tesseract = Tesseract();
tesseract.language = "eng";
tesseract.delegate = self;
tesseract.image = self.image.blackAndWhite();
tesseract.recognize();
NSLog("%@", tesseract.recognizedText);
}
图像保存到相机胶卷,如果我取消对注释行的注释,图像将完全清晰可见。不知道为什么它不起作用。如果将图像作为支持文件直接上传到 Xcode 中,则读取图像上的文本没有问题,但如果我在屏幕上拍摄完全相同的图像,则无法读取。
最佳答案
偶然发现本教程:http://www.raywenderlich.com/93276/implementing-tesseract-ocr-ios
刚好提到缩放图片。他们选择的最大尺寸为 640。我将我的照片设为 640x480,所以我认为我不需要缩放它们,但我认为这段代码本质上是重新绘制图像。出于某种原因,现在我的照片 OCR 相当好。我仍然需要为较小的文本进行图像处理,但它非常适合大文本。通过这个缩放函数运行我的图像,我很高兴。
func scaleImage(image: UIImage, maxDimension: CGFloat) -> UIImage {
var scaledSize = CGSize(width: maxDimension, height: maxDimension)
var scaleFactor: CGFloat
if image.size.width > image.size.height {
scaleFactor = image.size.height / image.size.width
scaledSize.width = maxDimension
scaledSize.height = scaledSize.width * scaleFactor
} else {
scaleFactor = image.size.width / image.size.height
scaledSize.height = maxDimension
scaledSize.width = scaledSize.height * scaleFactor
}
UIGraphicsBeginImageContext(scaledSize)
image.drawInRect(CGRectMake(0, 0, scaledSize.width, scaledSize.height))
let scaledImage = UIGraphicsGetImageFromCurrentImageContext()
UIGraphicsEndImageContext()
return scaledImage
}
关于ios - Tesseract OCR w/iOS & Swift 返回错误或乱码,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29336501/
验证邮箱的正则表达式 var ePattern = /^([A-Za-z0-9_\-\.])+\@([A-Za-z0-9_\-\.])+\.([A-Za-z]{2,4})$/; 或者
我正在学习正则表达式并认为我开始掌握了。但是…… 我试图拆分一个字符串,我需要帮助来理解这样一个简单的事情: String input = "abcde"; System.out.println("[
我是初学者。我不知道为什么?我正在使用 Code::Blocks。请阅读以下代码: 如果 q=' W ',则打印出 W。 如果 q=" W ",则打印出 $。 最佳答案 文字 "W" 不是单个 cha
我在 BigQuery Reference 或 re2 wiki 中都找不到答案。 在 BigQuery Reference 中 Regex 部分的所有示例中,每个 regex 之前都有一个“r”,但
当我按“W 或 w”但仅一次时,我想让我的矩形/字符移动“X px”。按住“W”和“w”时不继续移动。我尝试使用一个变量创建一个“Key Released”函数,该变量在按下“W 或 w”时会发生变化
%w[ ] Non-interpolated Array of words, separated by whitespace %W[ ] Interpolated Array of words
我使用 vim。在我曾经使用过的每台机器上,“w”都尊重标点符号。如果我按“w”,我会前进到一个词的结尾。 如果是句点分隔词,我将移至下一个句点。 然而,在特定的 vim 安装中,'w' 被解释为 '
(\w+)?有什么区别吗和 (\w*)在正则表达式中? 似乎是一样的,不是吗? 最佳答案 (\w+)?和 (\w*)两者匹配相同(0..+inf 单词字符) 但是,有一点不同: 在第一种情况下,如果正
在 Ruby 中 %w(don matt james) 和 %w[don matt james] 有区别吗? 使用 Ruby 控制台,它们都输出一个数组,每个单词作为一个元素。我很好奇为什么有多种方法
我真的很想帮助您决定字母表中所有单词的语言是否{0,1}不能从两边以同样的方式读取,{ w | w <> wR } , 是一种上下文无关语言(即可以转化为特定的语法规则)。 我试图通过抽水引理证明它不
这是我的 Xml 文档(小片段)。
:q 和 :Q 也是如此。我几乎总是不会足够快地放弃转变,看到 :Q 和 :W 无论如何都没有被使用,我认为让它们像小写字母一样做会很好。 最佳答案 黑客是通过 :cmap或 :cabb ,但这些都有
我对/\w\b\w/感到困惑。我认为它应该匹配“we we”中的“e w”,因为: \w 是单词字符,即“e” \b 是单词 broundary,它是 ""(空格) \w 是另一个词是“w” 所以匹配
在 Linux 中,我的目录中有一个名为 test2 的文件,该文件是我使用 touch 命令创建的。 当我运行命令时 find . –name “*test*” -ls 它不会给我错误,但是当我运行
我想把一个句子分成单词和单词之间的部分(我称之为定界符)。 sentence = "First-tea,-then-coffee!" => "First-tea,-then-coffee!" word
我正在查看 Ruby 的文档。我对使用 %w() 还是 %W() 感到困惑(后面的 W 是大写的)。两者有什么区别?你能给我指点一些文档吗? 最佳答案 当大写时,数组由插入的字符串构成,就像在双引号字
有什么区别? 最佳答案 %w 引用像单引号 ''(没有变量插值,转义序列更少),而 %W 引用像双引号 ""。 irb(main):001:0> foo="hello" => "hello" irb(
这是运行 XQueries 之前的 XML 文档示例: ... 1.7 ****
除非我为 TableTypeCarrier 模板类包含一个复制构造函数,否则使用 clang(但不是 gcc)构建时,以下代码会在运行时崩溃吗?如果我包含该复制构造函数,为什么我在使用 gcc 构建时
尝试: time perl -E '$x="a" x 100000; $x =~ /[\w\W]+x/i' 将运行很长时间(在我的笔记本上20秒)。没有/i,例如 time perl -E '$x=
我是一名优秀的程序员,十分优秀!