gpt4 book ai didi

c++ - 使用 Tesseract 进行页面布局分析?

转载 作者:IT老高 更新时间:2023-10-28 22:59:00 25 4
gpt4 key购买 nike

Tesseract 3能够执行页面布局分析。但是,我找不到任何关于如何将库用于此类目的的示例代码或文档。我希望这里有人可以解释如何对图像执行布局分析以及如何解析结果数据。

最佳答案

Tesseract 可以被赋予一个页面模式参数(-psm),它可以有以下值:

  • 0 = 仅限方向和脚本检测 (OSD)。
  • 1 = 使用 OSD 自动分割页面。
  • 2 = 自动页面分割,但没有 OSD 或 OCR
  • 3 = 全自动页面分割,但没有 OSD。 (默认)
  • 4 = 假设有一列可变大小的文本。
  • 5 = 假设一个统一的垂直对齐文本 block 。
  • 6 = 假设一个统一的文本 block 。
  • 7 = 将图像视为单个文本行。
  • 8 = 将图像视为一个单词。
  • 9 = 将图像视为圆圈中的单个单词。
  • 10 = 将图像视为单个字符。

例子:

tesseract image.tif image.txt -l eng -psm 0

但是,我不确定是否可以在独立模式下使用布局分析。

关于c++ - 使用 Tesseract 进行页面布局分析?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8114703/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com