gpt4 book ai didi

python - 用python识别文本布局

转载 作者:太空狗 更新时间:2023-10-29 21:06:13 25 4
gpt4 key购买 nike

我正在尝试对数千个扫描文件进行分类,并根据类型将它们分类到文件夹中(即:如果其中一个文件是 formA 的扫描副本,那么它应该放在 formA 文件夹中,如果它是扫描的formB 的副本,然后它应该放在 formB 文件夹中,等等...)。我觉得匹配文件和类型的最佳方法是基于它们的文本轮廓,但我对图像处理是全新的,所以如果有更好的解决方案,那么我会洗耳恭听。

我在 python 工作。关于执行此操作的最佳方法的任何想法?太平船务?打开简历?图像魔术?

提前致谢...

最佳答案

您可能对这个库感兴趣 -
http://code.google.com/p/ocropus/
它由 googlers 制作,可让您从 python 进行 OCR 和布局分析。
我在安装它时遇到了一些问题,但那是很久以前的事了,所以现在可能已经解决了。

关于python - 用python识别文本布局,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6656012/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com