gpt4 book ai didi

python - 从扫描的工程图纸中提取文本

转载 作者:太空宇宙 更新时间:2023-11-03 21:13:31 25 4
gpt4 key购买 nike

我正在尝试从扫描的技术图纸中提取文本。出于保密原因,我无法发布实际图纸,但它看起来类似于 this ,但形状内的文本更多。由于字母相互接触及其周围的边框/符号的问题,问题非常复杂。

我发现了一篇有趣的论文,叫做“从数字工程图纸中检测文本区域”,作者是路朝阳。它在付费专区后面,因此您可能无法访问它,但本质上它会尝试通过主要两个步骤从图像中删除非文本的所有内容:

1) 删除线性分量,包括长短隔离线

2) 根据笔划的连通分量分析删除非文本笔划

什么样的 OpenCV 函数可以帮助执行这些操作?我宁愿不从头开始写一些东西来做这些,但我怀疑我可能不得不这样做。

我曾尝试使用基于模板的方法来尝试隔离文本,但由于文本位置在图形之间没有完全标准化(即使在同一项目中),它无法检测到第一个扫描图形之后的文本.

最佳答案

我正在处理类似的问题。技术图纸是一个问题,因为 OCR 软件主要试图找到文本基线,而绘图工件(线条等)妨碍了这种方法。在您指定的图形中,相互接触的字符不多。所以我建议将图像分成连续的(黑色)像素,然后单独扫描这些像素。相邻区域的高度还应指示相邻区域是文本还是绘图。要将图像分解成连续的像素,请使用洪水填充算法,并且对于扫描 Tesseract 做得很好。

关于python - 从扫描的工程图纸中提取文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45621066/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com