image - 与 OCR 逆向工程作斗争-6ren

image - 与 OCR 逆向工程作斗争

转载作者：行者123 更新时间：2023-12-02 17:50:20

27

4

我指的是基于软件的 OCR？图像到文本引擎的转换工具，stackoverflow 上有大量关于构建 OCR 的帖子，但我的看法恰恰相反，就像关于如何保护我的图像免受逆向工程的任何指导。

例如，我有只包含文本的图像，我怎样才能让任何人都难以解码数据，是否有任何所需的图像格式可以做到这一点？或者我们可以混淆图像？

使用特殊字体或失真能否保证 OCR 保护？尽管我的要求不允许提供太多扭曲的文本。

任何方向都会很有帮助

最佳答案

据我所知，您收集了一些受版权保护的文本，这些文本应该可供人类清晰阅读，但您不希望它以电子形式从您的服务器中泄露。我认为混淆文本使其更难进行 OCR 不是一个好主意，因为它会使人类无法阅读，尤其是在文本非常长的情况下。基本上，人类容易阅读的内容可以完美地进行 OCR 编辑。 OCR 困难的事情对人来说也很困难。在最坏的情况下，攻击者可能会雇用一家印度公司来手动重新输入文本，这实际上并没有那么昂贵。

我会建议你寻找其他方面来做好保护。您的用例如何？为什么用户可以在他们的 PC 上将您的文本作为图像获取？他们下载的是 PDF 还是图像文件？在这种情况下，与下载文件的可能性作斗争而不是使其不可读会简单得多。

例如，您可能会考虑不立即授予对整个文件的访问权限，而是逐页显示它，并需要人工交互才能进入下一页。您甚至可能会扰乱您的 Web 界面，使其无法通过典型的站点下载实用程序下载所有内容。每个页面都应显示在相同的 URL 上，但实际导航应使用 AJAX 或什至某些专有接口(interface)与服务器通信。

另一种方法是在每个页面上制作许多人类不可见的虚假链接，但它们会误导下载实用程序，使他们下载大量错误的内容，或以错误的顺序下载使其无法使用。

如果您能成功地对抗自动下载，您甚至不必以图像形式提供您的内容，它可以是纯文本，但只是其中的一小部分。它无论如何都无法使用。

希望这能让您知道该走哪条路。

关于image - 与 OCR 逆向工程作斗争，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/9138333/

27

4

0

文章推荐： HTML - 如何在一个页面上有效地做多个 Facebook Like 按钮

文章推荐：某个类的所有跨度的标题的css

文章推荐： WHERE 子句中的 Oracle CASE

iphone - 逆向工程？
我有 *.ipa 文件，它是 iphone 应用程序。是否可以在该 ipa 中使用逆向工程并提取代码..? 最佳答案嗯，这不是真正的黑客攻击，但它确实可以帮助您识别 UI 的某些部分...请执行以
bit - 逆向工程，左移七位
我一直在尝试对游戏的功能进行逆向工程，但我有点困惑。我对逆向工程还很陌生(顺便说一句，我正在使用 ollydbg)，所以我还不太了解所有的技巧和细节。无论如何这是我的问题。当您在游戏中拾取任何元素时
flash - 逆向工程 AMF
我被要求抓取一个 Flash 网站，该网站似乎正在通过 AMF 协议(protocol)使用某种服务器端调用。我完全不熟悉这个协议(protocol)，但找到了这个库(http://www.pyamf
php - 记录或比较mysql运行前后的数据-逆向工程
我的问题是我正在使用一个巨大的网络应用程序(学校系统)，没有内部逻辑的文档。我需要对特定值进行批量更新，但我不知道MySQL数据库中的哪些表包含要更新的相关数据。该应用程序是从 php 自行运行的。有
c - 逆向工程——使用调试信息进行编译
我正在学习如何逆向一个程序，我想知道..如果我用调试信息编译: gcc -g .... 这对逆向过程有什么帮助吗？如果我这样做，我会提供额外的信息吗？我找不到有关该主题的任何信息。最佳答案它通过将
C++:依赖跟踪工具(逆向工程)
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题，以便用事实和引用来回答。关闭 5 年前。
c++ - 逆向工程 C++
今天我决定使用 IDA Pro 反编译一个用 Visual C++ 编写的简单“Hello world”程序。根据我以前的知识，我确定我不会在可执行文件入口点找到对 printf 的立即调用，我是对
database - PowerDesigner + 逆向工程
我正在使用 PowerDesigner 为我的 SQL Server 数据库建模。我使用逆向工程选项来导入我的数据库。我的问题是表中的默认数据未导入。有人知道如何导入表格中的数据吗？最佳答案我们
checksum - 逆向工程 "checksum"代
我一直在分析一些 230V 通信并试图找出协议(protocol)的校验和算法。从我了解到的通信结构如下: 第一个 block 总是相同的，必须是某种开始结构(910hex) 然后嵌套5个 block
driver - 逆向工程 Amiga 监控文件
在 AmigaOS 中的 Devs:Monitors 中找到的文件，它们包含什么？它们的内部格式是什么？您如何修补一个或从头开始创建一个？最佳答案 Amiga 程序 MonEd ( http://
c# - “逆向工程”模型优先 - 删除表和列前缀
我正在使用 VS2013 更新 3 的“逆向工程”模型优先功能从现有数据库开发 EF 模型。不幸的是，我无法完全控制数据库架构，它使用表和列前缀(例如 tblPerson , cFirstName,
android - 逆向工程 Proguarded-apk
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。这个问题似乎不是关于 a specific programming problem, a softwar
android - 逆向工程 Android Assets
我正在尝试对 APK 文件进行逆向工程。我尝试了 apk2jar 来获取类和资源文件。但我无法解压缩 Assets 。有人可以帮忙吗？最佳答案使用 apktool。它将对所有布局、值、 Ass
android - 逆向工程 HTTP 请求
我正在尝试解码由 Android instagram 应用程序发送到 graph.instagram.com 的帖子数据。该问题与此处发现的问题类似: Reverse Engineer HTTP re
c++ - 逆向工程 OSX 用户诊断报告堆栈跟踪
我想查明用 C/C++ 编写的应用程序究竟在哪里失败。我无法直接调试应用程序，既不使用 gdb/lldb 也不使用 IDE，因为应用程序是由程序启动的(它是 webots 机器人模拟软件的机器人 Co
c++ - 逆向工程 C++ - 最好的工具和方法
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。要求我们推荐或查找书籍、工具、软件库、教程或其他场外资源的问题对于 Stack Overflow 来说是
c++ - 逆向工程 C++ DLL
我有一个最初用 VS2005 编写的小实用程序。我需要做一点小改动，但是其中一个 dll 的源代码在某处丢失了。是否有免费或价格合理的工具将 dll 反向工程回 C++ 代码。最佳答案 Hex-
javascript - 逆向工程 Web 应用程序
关闭。这个问题是off-topic .它目前不接受答案。想改进这个问题吗？ Update the question所以它是on-topic用于堆栈溢出。关闭 9 年前。 Improve this
database - 逆向工程 Access 数据库
我想知道是否有人知道如何对 Access 数据库进行逆向工程。我希望能够生成用于创建数据库表并将所有记录插入表中的 SQL 代码。换句话说，我想创建类似于 MySQL 转储文件的内容。任何想法都会很
c# - 逆向工程 String.GetHashCode
String.GetHashCode 的行为取决于程序架构。所以它将在 x86 中返回一个值，在 x64 中返回一个值。我有一个必须在 x86 上运行的测试应用程序，它必须预测必须在 x64 上运行的

首页

博学

6Ren·AI

商城

image - 与 OCR 逆向工程作斗争