gpt4 book ai didi

用于图像识别的 C++ 库 : images containing words to string

转载 作者:塔克拉玛干 更新时间:2023-11-02 23:07:54 24 4
gpt4 key购买 nike

有谁知道用于拍摄图像并对其执行图像识别的 C++ 库,以便它可以根据给定的字体和/或字体高度找到字母?即使是不允许您选择字体的字体也不错(例如:readLetters(Image image))。

最佳答案

我最近一直在研究这个问题。你最好的就是 Tesseract。如果您需要在 OCR 之上进行布局分析而不是使用 Ocropus(它又使用 Tesseract 来执行 OCR)。布局分析是指能够检测文本在图像上的位置,并进行线分割、 block 分割等操作。

通过对 Tesseract 的实验,我发现了一些非常好的技巧,值得分享。基本上我必须对图像进行大量预处理。

  1. 将输入图像放大/缩小到 300 dpi。
  2. 从图像中移除颜色。灰度很好。我实际上使用了抖动阈值并将我的输入设为黑白。
  3. 从您的图片中删除不必要的垃圾。对于以上所有三个,我使用 netbpm(一组用于 unix 的图像处理工具)来达到我需要的几乎 100% 的准确度。

如果你有一个高度定制的字体并且单独使用 tesseract,你必须“训练”系统——基本上你必须提供一堆训练数据。这在 tesseract-ocr 站点上有详细记录。您实质上为您的字体创建了一种新的“语言”,并使用 -l 参数将其传入。

我发现的另一种训练机制是使用神经网络 (bpnet) 训练的 Ocropus。建立一个好的统计模型需要大量的输入数据。

在调用 Tesseract/Ocropus 方面都是 C++。它不会像 ReadLines(Image) 那样简单,但您可以查看一个 API。您也可以通过命令行调用。

关于用于图像识别的 C++ 库 : images containing words to string,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/462860/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com