java - TessBaseAPI 无法解析符号 tess-two OCR Android-6ren

java - TessBaseAPI 无法解析符号 tess-two OCR Android

转载作者：行者123 更新时间：2023-11-30 02:07:30

34

4

我正在尝试使用 tess-two 为 OCR 运行演示应用程序，但我遇到了代码问题:

我已按照以下步骤操作:

首先，我从这里下载并安装了 ndk https://developer.android.com/tools/sdk/ndk/index.html .而且我配置成功然后我从这里下载“tess-two-master”https://github.com/rmtheis/tess-two然后我提取它，在那个位置我运行 ndk-build 命令并且它也编译成功。然后我打开一个全新的 Android Studio 项目并按照这些说明进行操作 https://coderwall.com/p/eurvaq/tesseract-with-andoird-and-gradle来自“使用 gradle 配置 tess-two”部分在最后一步中，我进入“文件 -> 项目结构 -> 从左侧子窗口中选择一个模块 -> 依赖项(最后一个选项卡) -> 按右侧的绿色“+” -> 模块依赖项 -> 确定”

之后我下载了这个项目https://github.com/GautamGupta/Simple-Android-OCR我在我的新项目中复制并粘贴了这些文件中的代码:“SimpleAndroidOCRActivity.java”、“main.xml”、“strings.xml”。当然，我的文件有不同的名称(在我的例子中是“MainActivity.java”、“activity_main.xml”、“strings.xml”)，所以在代码中进行一些重命名是必要的。我还打开了我的“AndroidManifest.xml”，并在刚下载的“AndroidManifest.xml”中的“/application”和“/manifest”之间的末尾(但在“/manifest”之前)添加(这意味着我已经添加了它“使用权限”和“使用功能”标签)。

我从这里下载的最后一步 https://code.google.com/p/tesseract-ocr/downloads/list英文文件。在我项目的文件夹中，excatly 在“app-->src-->main”中。我在这里创建了一个新文件夹并将其命名为“assets”。在该文件夹中，我创建了另一个名为“tessdata”的文件夹。我把它放在那里我的 .traineddata 文件。

然后当我尝试同步它时，出现以下错误:Warning:Dependency OCR3:app:unspecified 项目 tess-two 解析为不支持作为编译依赖项的 APK 存档。文件:C:\Users\jana-PC\AndroidStudioProjects\OCR3\app\build\outputs\apk\app-release-unsigned.apk

当我尝试编译它时，它没有编译，因为它向我显示 TessBaseAPI 无法解析符号的错误:

这部分我的代码是:

import com.googlecode.tesseract.android.TessBaseAPI;



        TessBaseAPI baseApi = new TessBaseAPI();
        baseApi.setDebug(true);
        baseApi.init(DATA_PATH, lang);
        baseApi.setImage(bitmap);

        String recognizedText = baseApi.getUTF8Text();

        baseApi.end();

任何人提供一些帮助，我将不胜感激!!

最佳答案

您是否尝试过此解决方案:https://coderwall.com/p/eurvaq/tesseract-with-andoird-and-gradle

关于java - TessBaseAPI 无法解析符号 tess-two OCR Android，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/30470880/

34

4

0

文章推荐： android - ionic 运行 android : build/run succeeds, 但导致黑屏

文章推荐： android - 更新 ListView 页脚

文章推荐： java - 在 Mint 16 上安装 Android Studio 时出现问题

ocr - OCR 不再是问题吗？
根据 Wikipedia 的说法，“拉丁文打字文本的准确识别现在被认为在很大程度上解决了可以提供清晰成像的应用程序(例如扫描打印文档)的问题。”但是，它没有给出引用。我的问题是:这是真的吗？当前最先
ocr - OCR 中的格鲁吉亚语
我在将包含文本图像的 JPG 文件转换为文本文件时遇到问题。我尝试了 ABBYY 的 OCR SDK 和其他一些 OCR 来源，但没有一个包含格鲁吉亚语。你能告诉我是否有任何可用于格鲁吉亚语的 OC
ocr - OCR 简介
有人给了我一大堆惊人的信息。它是 200MB 的 .tiff 扫描公告图像，可以追溯到 40 年代。我想将其数字化，但我对 OCR 一无所知。一些早期的 Material 几乎无法被人类阅读，更不用说
ocr - 有没有办法用小字体改进tesseract OCR？
我正在尝试通过 python-tesseract 使用 tesseract-OCR 来读取看起来像这样的低分辨率字体: 不幸的是，该图像返回 ZIJZHZI 我认为分辨率太低，这会导致问题。我试过放大
ocr - OCR 软件能否可靠地从表格中读取值？
OCR 软件是否能够可靠地将如下图像转换为值列表？更新: 更详细的任务如下: 我们有一个客户端应用程序，用户可以在其中打开报告。此报告包含一个值表。但并不是每个报告看起来都一样——不同的字体、不同
ocr - Tesseract OCR - 手写字体
我正在尝试使用 Tesseract-OCR检测其中包含纯文本的图像文本，但这些文本具有名为Journal 的手写字体。例子: 结果不是最好的: Maxima! size` W (35) 有没有可能改
ocr - 使用 OCR 识别上标字符
我已经开始了一个简单的项目，它必须获得一个包含带有上标的文本的图像，然后通过使用 OCR(目前我正在使用 tesseract)它必须识别上标字符 + 正常字符。例如，我们有一个化学方程式，例如 Cl
ocr - 是否存在 OCR 无法识别的字体？
关闭。这个问题是off-topic .它目前不接受答案。想改善这个问题吗？ Update the question所以它是 on-topic对于堆栈溢出。 8年前关闭。 Improve this q
ocr - 波斯语 OCR 问题
我目前正在研究 OCR(波斯语)，尽管“fas.traineddata”在tessdata中可用，但是当我使用以下命令时，什么也没发生: import pytesseract from PIL im
ocr - Tesseract OCR 可以识别下标和上标吗？
我对文本片段中下标和上标的一般识别有疑问。示例图片: 我使用 Tesseract 4.1.1 和 https://github.com/tesseract-ocr/tessdata_best 下可用
ocr - Tesseract OCR 培训的替代方案？
在过去的 3 个月里，我一直在尝试训练 Tesseract 通过识别我拥有的图像集合，由于真正的缺乏正确的文档，以及非常高的复杂性，我开始放弃将 Tesseract 作为解决方案。我正在寻找一种
ocr - 是否有一个 OCR 库可以输出在图像中找到的单词的坐标？
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。想改进这个问题？将问题更新为 on-topic对于堆栈溢出。 12 个月前关闭。 Improve this
ocr - 最好的 OCR 开源拼写检查器？
已结束。此问题正在寻求书籍、工具、软件库等的推荐。它不满足Stack Overflow guidelines 。目前不接受答案。我们不允许提出寻求书籍、工具、软件库等推荐的问题。您可以编辑问题，以便
ocr - 如何 "OCR"我的电表图片？
下面是我的电表读数 52425.5(粗略)的图片: 什么程序/技术可以帮助我自动抄表？备注: 这是较为清晰的图像之一。许多图像都有静态。我可以忽略(让程序说“错误”)带有太多静态的图片。相机有一个固
ocr - 大写字母的常见 OCR 错误有哪些？
大写字母OCR(光学字符识别)的常见错误有哪些？例如FOR -> FOB 最佳答案要获得最准确的答案，最好使用针对您的问题的特定数据样本自行测试。不同字符/单词组合的错误率可能有很大差异，具体取决
ocr - Tesseract OCR - 将复选框识别为单词
对于我想教 Tesseract 将复选框识别为单词的客户。当 Tesseract 应该识别一个空的复选框时，它工作得很好。此命令与 this 结合使用教程就像一个魅力，Tesseract 能够找到空
ocr - 具有表格或行的文档的 Tesseract OCR 文本顺序
我正在使用 Tesseract OCR将扫描的 PDF 转换为纯文本。总体而言，它非常有效，但我对扫描文本的顺序有疑问。带有表格数据的文档似乎是逐列向下扫描，而更自然的方式是逐行扫描。一个非常小的例子
ocr - 土耳其语版 Tesseract OCR 多维数据集文件
在哪里可以找到 cube 的 tesseract ocr 土耳其语扩展模式？文件: tr.cube.fold tr.cube.lm tr.cube.nn tr.cube.params tr.cube
ocr - 为 Tesseract OCR 创建训练图像
我正在编写一个用于训练 Tesseract OCR 图像的生成器。在为 Tesseract OCR 的新字体生成训练图像时，最佳值是什么: 新闻部以磅为单位的字体大小字体是否应该抗锯齿边界框是
ocr - 如何通过 tesseract OCR 识别带有少量数学符号的文本？
我的文本带有一些不那么复杂的数学符号，如下所示。 Tesseract OCR 默认无法识别此类数学符号(+-、角度)。我如何通过 tesseract 识别这些数学符号？最佳答案只需使用以下语句:

首页

博学

6Ren·AI

商城

java - TessBaseAPI 无法解析符号 tess-two OCR Android