- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我正在尝试开发一个WindowsPhone8.1应用程序,但我需要识别来自不同显示器的一些号码。
我在遵循这个例子:
http://bsubramanyamraju.blogspot.com/2014/08/windowsphone-81-optical-character.html
正在使用Microsoft OCR运行库:
https://www.nuget.org/packages/Microsoft.Windows.Ocr/
不过,当我试图辨认出那些照片时,它就不起作用了。甚至我也发现了这个网站:
https://www.unix-ag.uni-kl.de/~auerswal/ssocr/
有人有推荐信吗?或者有人知道与之相关的代码吗?
谢谢你的宝贵知识。
最佳答案
我希望你的问题的答案是“当然,这里是”与黑匣子进程链接任何ocr工具,但有几个方面涉及,这是最好分开考虑。
首先,在你考虑任何ocr之前,有一些关于图像预处理的工作。你的图片样本大不相同,包含了所有的问题。
示例1的对比度较低,因此当它被二值化为黑白层(大多数ocr在某个阶段将在内部执行)时,没有要处理的字符。经过二值化处理后如下:
有关图像预处理的其他详细信息,请参阅此ocr博客:http://www.ocr-it.com/guide-to-better-mobile-images-from-cell-phone-camera-for-higher-quality-ocr。
其次,图像的头部没有dpi信息,一些ocr技术使用这些信息来确定图像的适当比例。如果没有标题信息,某些ocr程序可能会设置某些默认dpi,这可能与图像匹配,也可能与图像不匹配,从而影响ocr结果。这并不重要,但如果可以在图片创建时实现,则首选。
样本2具有足够的对比度,自适应公证返回清晰图像。头文件中也缺少dpi分辨率值。
示例3具有非常清晰的对比度,但在标题中也没有分辨率dpi。
一旦你有了为ocr处理优化的图像,下一步就是研究ocr技术。
我没有测试你曾经提到的,假设你有正确的实现,但没有成功与他们。我测试了我以前使用过的其他ocr工具。
一般来说,我不知道有7段ocr。然而,我能够适应这个特殊任务的其他通用ocr。我尝试过的所有“开箱即用”或默认设置的ocr都无法处理此识别。这是合乎逻辑的。为什么?因为大多数普通的ocr是用来识别每个字符不可分割的像素模式的。这与“字符可分性”原则有关,该原则用于将单词分隔成单独的字符。换句话说,内部ocr算法寻找组成每个字符的连接笔划。更强大的商业ocr允许在像素模式上有一些中断,但它们应该是最小到无的,比如打印或扫描中的缺陷,这可能会导致字符片段丢失。
7段显示本质上将在每个字符中有多个中断,这与字符可分性原则相冲突。
更强大的ocr技术具有a)更大的像素模式中断容忍度和/或b)具有特殊设置来处理这些情况。
我将使用ocr-it基于web的ocr api平台进行进一步的测试,这是我所熟知的。我是ocr功能的开发人员。我也在自己的ios和android应用程序中广泛使用它。OCR-IT API基于强大的商业OCR引擎,因此它对字符缺陷具有很好的容忍能力,并且在这种情况下可以使用一些控件。
样本3.这是最容易处理的样品,所以我先测试了一下。使用ocr-it api,使用默认设置发出请求,请求输出为txt格式,我得到以下结果:
ocr似乎是a)将字符分割成两个单独的行,b)尝试读取尽可能接近有效字符的结果模式。
基于此快速分析,对OCR设置进行一次调整将导致以下识别:
在ocr结果中产生重大差异的设置是从默认打印类型切换到使用“dotmatrix”,它位于整个ocr-it api设置xml的中间:
<Job>
<InputURL>http://i.stack.imgur.com/wOtFx.jpg</InputURL>
<CleanupSettings>
<Deskew>false</Deskew>
<RemoveGarbage>false</RemoveGarbage>
<RemoveTexture>false</RemoveTexture>
<RotationType>NoRotation</RotationType>
</CleanupSettings>
<OCRSettings>
<PrintType>DotMatrix</PrintType>
<OCRLanguage>English</OCRLanguage>
<SpeedOCR>false</SpeedOCR>
<AnalysisMode>MixedDocument</AnalysisMode>
<LookForBarcodes>false</LookForBarcodes>
</OCRSettings>
<OutputSettings>
<ExportFormat>Text</ExportFormat>
</OutputSettings>
</Job>
关于c# - 有谁知道用于Windows Phone的OCRing 7段显示器的任何API?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28399756/
关闭。这个问题是off-topic .它目前不接受答案。 想改进这个问题? Update the question所以它是on-topic对于堆栈溢出。 9年前关闭。 Improve this que
我有一堆 php 脚本计划在 CentOS 机器上的 cron 中每隔几分钟运行一次。我希望每个脚本在启动时自我检查它的前一个实例是否仍在运行,如果是则停止。 最佳答案 我这样做是为了管理任务并确保它
是否有 bash 命令、程序或 libusb 函数(尽管我没有找到)来指示 USB 设备的 OUT 或 IN 端点是什么? 例如,libusb_interface_descriptor(来自 libu
我如何知道 NSTextField 何时成为第一响应者(即当用户单击它来激活它时,但在他们开始输入之前)。我尝试了 controlTextDidBeginEditing 但直到用户键入第一个字符后才会
我怎么知道我的代码何时完成循环?完成后我还得再运行一些代码,但只有当我在那里写的所有东西都完成后它才能运行。 obj.data.forEach(function(collection) {
我正在使用音频标签,我希望它能计算播放了多少次。 我的代码是这样的: ; ; ; 然后在一个javascript文件中 Var n=0; function doing(onplaying)
我正在尝试向 Package-Explorer 的项目上下文菜单添加一个子菜单。但是,我找不到该菜单的 menuid。 所以我的问题是如何在 eclipse 中找到 menuid? 非常感谢您的帮助。
我有一个名为“下一步”的按钮,它存在于几个 asp.net 页面中。实际上它是在用户控件中。单击“下一步”时,它会调用 JavaScript 中的函数 CheckServicesAndStates。我
我正在尝试在 Visual Studio 中使用 C++ 以纳秒为单位计算耗时。我做了一些测试,结果总是以 00 结尾。这是否意味着我的处理器(Ryzen 7-1800X)不支持 ~1 纳秒的分辨率,
我有一个自定义 ListView ,其中包含一些元素和一个复选框。当我点击一个按钮时。我想知道已检查的元素的位置。下面是我的代码 public class Results extends ListAc
如何在使用 J2ME 编写的应用程序中获取网络运营商名称? 我最近正在尝试在 Nokia s40 上开发一个应用程序,它应该具有对特定网络运营商的独占访问权限。有没有这样的API或库? 最佳答案 没有
我使用服务器客户端组件,当在此组件的 TransferFile 事件中接收文件时,我使用警报消息组件。所以我希望,如果用户单击警报消息,程序将继续执行 TransferFile 事件中的代码,以在单击
如果我创建一个类A具有一些属性,例如 a, b, c我创建对象 A x1; A x2; A x3; ... A xN 。有没有办法在同一个类中创建一个方法来检索我创建的所有对象?我想创建类似 stat
我正在制作一个应用程序,其中包含相同布局的 81 个按钮。它们都被称为我创建的名为“Tile”的对象。问题是这些图 block 存储在数组中,因此我需要知道以 int 格式单击了哪个按钮才能调用图 b
UIProgressView有这个setProgress:animated: API。 有没有办法确切知道动画何时停止? 我的意思是这样的? [myProgress setProgress:0.8f
我正在使用两个 jQuery 队列,我希望其中一个队列在另一个队列完成后出队。我怎么知道第一个是否完成?我应该使用第三个队列吗?! 这是我所拥有的: var $q = $({}); $q.que
jQuery 中有没有一种方法可以知道是否至少有一个复选框已被选中? 我有一个包含很多复选框的表单,每个复选框都不同。 我需要一种 jQuery 的方式来表达这样的内容,这就是逻辑: If at le
给定 2 个选择 100 50 100 在这两种情况下,我都想在 .example 中获取数字,使用相同的选择器或者以某种方式知道 .no-text 和 之间的区别。带文字 执行
我在我的应用程序中使用 System.ComponentModel.BindingList 作为 DataGridView.DataSource。该列表非常大,需要几秒钟才能绘制到 DataGridV
我想知道用户在 Android 中选择的默认键盘。我知道我可以使用 InputMethodManager 访问已启用的输入法列表,但我想知道用户当前使用的是哪一个。 到目前为止,我已经尝试获取当前的输
我是一名优秀的程序员,十分优秀!