- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
我正在开发一个 Android 应用程序,它可以拍摄照片并将其翻译成文本。我在 Windows 上使用 tesseract 3。
我已经设法使大部分翻译工作正常(在进行重新缩放、二值化、增强后),但某些字符仍未按应有的方式翻译(ri -> m、le -> Ie 等)。
为了纠正这个问题,我正在考虑强制 tesseract 查看我的语言词典(在我的例子中是法语)并使用最可能的词进行翻译。当我打开法语词典时,我很惊讶地看到了每一个英语单词。
有没有办法强制 tesseract 在适当的语言中找到最可能的词?
此外,我没有在网上找到很多 android 代码示例,而且我不确定我是否在进行最有效的图像预处理。这就是我目前正在做的事情,您知道我该如何进一步改进吗?
photo = WriteFile.writeBitmap(Scale.scale(ReadFile.readBitmap(bitmap), 3, 3));
photo = WriteFile.writeBitmap(AdaptiveMap.backgroundNormMorph(ReadFile.readBitmap(photo)));
photo = WriteFile.writeBitmap(Binarize.otsuAdaptiveThreshold(ReadFile.readBitmap(photo)));
photo = WriteFile.writeBitmap(Enhance.unsharpMasking(ReadFile.readBitmap(photo), 3, (float) 0.5));
谢谢你的帮助
编辑:例如,这是我得到的结果
和文本结果:
Les actions sociales
Les actions sociales regroupent les activités suivantes: Heureux évenements + Aide handicap + Aide scolarité + aide étudiante + Aide de secours, Malgré un nombre de bénéficiaires plus important et un coat moyen par activité plus éleve qu'en 2012, Ie budget 2013 alloué couvre largement les besoins d’ou l'excédent constaté La C.F.T.C. ne peut que regretter la suppression en 2013 de I‘activité «abonnement enfant» car son financement aurait pu étre couvert par l'excédent constaté
谢谢你:)
最佳答案
Tesseract 有 user.dawg 文件,您可以在其中添加要添加到其词典中的单词。
但我要做的是通过额外的检查来运行输出。编写一个程序,按空格拆分文本,删除标点符号,然后检查字典中的每个单词 - 如果该单词完全匹配,那么这就是真正的单词,如果不是,则使用 Levenshtein 将该单词与其他单词进行比较距离。
我假设你的字典将是一个数据库,这样你就可以做其他聪明的事情,你可以只写一个查询来搜索确切的词(显然),但是当找不到这个词时使用 LIKE operator在 SQL 中以您选择的方式查找相似的单词(例如,所有以相同字母开头的单词),因此您仅对以相同字母开头的单词(或看起来像您的单词的单词)运行 Levenstein 距离您选择的方式),从而避免不必要的比较。
关于Android OCR 应用程序 : Tesseract dictionary,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24867607/
我正在用 Python (2.6) 编写一个应用程序,需要我使用字典作为数据存储。 我很好奇拥有一个大字典是否更节省内存,或者将其分解为许多(很多)较小的字典,然后拥有一个包含对所有较小字典的引用的“
Convert this [ "Cat" : ["A" : 1, "B": 2], "Mat" : ["C" : 3, "D": 4] ] Into [ "A" : 1,
有什么很酷的快速方法可以让两个字典创建第三个字典,以内连接方式将第一个字典的键映射到第二个字典的值? Dictionary dic1 = new Dictionary {{a1,b1},{a2,b2}
我希望将字典相互嵌套,以便容纳 block 的 xy 坐标。所以我会 IDictionary, IDictionary> 键 Dictionary 包含列、行组合,而值 Dictionary 包含 x
在 C# 中,我需要将数据保存在字典对象中,如下所示: Dictionary> MyDict = new Dictionary>(); 现在我意识到,在某些情况下我需要一些其他(不是字典类的)
第一个Dictionary就像 Dictionary ParentDict = new Dictionary(); ParentDict.Add("A_1", "1")
我似乎无法理解这个问题。我需要使用 LINQ 按内部字典的值对字典进行排序。有什么想法吗? 最佳答案 你的意思是你想要所有的值,按内部值排序? from outerPair in outer from
我想建模一个模式,其中响应是字典: { 'id1': { 'type': 'type1', 'active': true, }, 'id2': { 'type':
我有以下代码要添加或更新(如果已经存在)dict()-dict 中的值: if id not in self.steps: self.steps[ id ] = step else:
我有一个包含字典的 Swift 字典,我想使用存储的属性来访问键值: var json = [NSObject:AnyObject]() var title: String { get
我想创建一个 Dictionary>结构,我想提供一个 IEqualityComparer在包含 APerson 的second 字典中作为关键 如果我只有内部字典,那就是 var f = new D
我有一个集合,其中包含如下文档:文档 1: { "company": "ABC" "application": { "app-1": {"earning_from_src_A": 50,
我正在快速学习。 我发现 dictionary 就像 hash 用于 PHP 或其他一些语言。 那我怎么制作dictionary的dictionary呢?? 我有这样的数据 key:J name:jh
这个问题在这里已经有了答案: Explode a dict - Get all combinations of the values in a dictionary (2 个答案) 关闭 5 个月前
我是编程新手,所以如果我的问题看起来很愚蠢,我很抱歉。我想问一下有没有办法从 Multi.Dictionary 返回key当我有值(value)? 这是我的代码: Dim myDict Set myD
我试图找出标准 Ada 库是否配备了“字典”类型(我的意思是:一种以 格式存储值的数据结构,我可以从中检索 value 使用相应的唯一 key)。 这样的数据结构存在吗?如果是这样,有人可以提供一个
我究竟做错了什么?根据我的测试,objDic.exists 永远不会给出 False! dim objDic set objDic = createobject("scripting.
我想创建一个复合类型,其中包含一个字典作为其命名字段之一。但是明显的语法不起作用。我敢肯定有一些我不明白的基本原理。下面是一个例子: type myType x::Dict() end Jul
julia> hotcell2vocab = Dict([(cell, i-1+vocab_start) for (i,cell) in enumerate(h
我有一个简单的问题:我对 Dictionary.Value 集合进行了很多次迭代,这让我很烦,我必须调用 .ToList() 然后才能调用 .ForEach(),因为它似乎没有可枚举的Dictiona
我是一名优秀的程序员,十分优秀!