gpt4 book ai didi

c# - Tesseract OCR 水平读取而不是垂直读取 C#

转载 作者:行者123 更新时间:2023-12-05 03:09:21 32 4
gpt4 key购买 nike

我们有一个 C# .Net 应用,它使用 Tesseract 对 .tiff 文件进行光学字符识别 (OCR)。这是一个例子: Example tiff fiel that Tesseract reads

然后我们将数据输出到文本文件。但是,Tesseract 正在以垂直方式读取数据。在我的示例图像中,它将 tiff 读取为两列数据,数据是从 Tesseract 输出的数据,如下所示:

类型:日期:地址:城市:状态:所有者:所有者类型:面积:抵押:123452017-04-06100 主街某个城市一些状态无名氏基本的10.25是的

我们想要的是 Tesseract 水平读取 tiff 文件并使输出看起来像这样:

类型:12345日期:2017-04-06地址:100 Main St.城市:某城市状态:一些状态所有者:John Doe所有者类型:初级面积:10.25抵押:有

我们已经为 Tesseract 尝试了各种 Page Sementation 选项,但它们都产生了相同的结果。

有人遇到过同样的问题吗?有人有什么想法吗?

最佳答案

我找到了一个解决方案。 Tesseract 有一组配置文件。其中几个配置文件中包含设置 tessedit_pageseg_mode。此设置在所有配置文件中都设置为 1。 1=使用 OSD 进行自动页面分割。 OSD=方向和脚本检测。

最重要的是,这些配置文件设置覆盖了我们的命令行参数。一旦我从配置文件中删除了 tessedit_pageseg_mode 参数,我们的命令行参数

-psm 6 工作并以所需格式生成输出数据。

psm=页面分割模式。 6=假设一个统一的文本 block

-psm 4 也有效

psm=页面分割模式。 4=假设一列可变大小的文本

关于c# - Tesseract OCR 水平读取而不是垂直读取 C#,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43259694/

32 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com