gpt4 book ai didi

opencv - 如何使用 opencv 正确地重新定向单个字符图像

转载 作者:太空宇宙 更新时间:2023-11-03 21:13:24 24 4
gpt4 key购买 nike

如何正确定位这些从无人机拍摄的字母图像。我试过 opencv 中的 fitellipse 函数,但它有时会以错误的方式拟合椭圆,导致以错误的方式旋转字母。

the ellipse fits it horizontally

Another example which when rotated wont give the proper letter

letter 'D' after orientation letter 'U' after orientation

cv2.fitellipse 给出椭圆长轴与 y 轴(逆时针方向)的夹角。我将图像逆时针旋转 180 度,以重新定向它,即使椭圆垂直/平行于 y 轴。

我之所以这样做,是因为 tesseract ocr 无法正确识别像这样的迷失方向的字母,即使在其“psm 10”模式下,用于单个字符识别。关于如何重新定向这些字母或如何使 tesseract 与迷失方向的字母一起工作的任何建议都会有很大帮助!

最佳答案

如果不了解您正在寻找的内容,您的方法将无法奏效。你不能简单地假设无论你取什么字母,椭圆拟合都会给你答案——对称字母呢?可以使字母显得扁平化的视角呢?您甚至可以使用 FFT 或 PCA 从创建字母的像素中获取主轴并估计其旋转,但出于同样的原因,它不会比椭圆拟合好多少。

一个可能的解决方案是旋转和缩放不变模式匹配,您会尝试在图像中找到所有可能的字母,但它可能会给您一些误报并且仅适用于单个(或类似)字体系列.如果它失败了,我会转向基于机器学习的方法,例如 SVM。

关于opencv - 如何使用 opencv 正确地重新定向单个字符图像,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48454982/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com