python - 如何校正和识别图像中的短文本-6ren

python - 如何校正和识别图像中的短文本

转载作者：太空宇宙更新时间：2023-11-03 21:40:17

25

4

我正在从事一个文本识别项目，该项目需要检测和识别图像中的文本。图片中有两条短线文字(320px * 320 px)。第一行是国家代码的缩写。第二行是拨号代码。整个图像可以任意角度旋转。以下是一些示例。

图片一

image one

图二

image two

图三

image three

由于文本很短，霍夫变换(检测长线)、傅里叶变换和轮廓投影等方法效果不佳。我正在使用轮廓检测来检测文本 block 的角度。但是，如果文本 block 是三角形的，它就不能很好地工作。此外，如果文本 block 是矩形，则在去歪斜后文本会出现上下颠倒、左侧朝下和右侧朝下的情况。有人可以建议吗？

file = r"/home/hank/Desktop/af_36.jpg"
image = cv2.imread(os.path.normpath(file))
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)

blur = cv2.GaussianBlur(gray, (3, 3), 0)
_, thresh = cv2.threshold(blur, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU)

kernel = cv2.getStructuringElement(cv2.MORPH_ELLIPSE, (3, 3))
dilation = cv2.dilate(thresh, kernel, iterations=1)

contours, hierarchy = cv2.findContours(dilation, cv2.RETR_TREE, cv2.CHAIN_APPROX_SIMPLE)

contours = [contours[i] for i in range(len(contours)) if
                 not (hierarchy[0][i][3] >= 0 and hierarchy[0][i][2] == -1)]

angles = []

for cnt in contours:
    rect = cv2.minAreaRect(cnt)
    angles.append(rect[2])

angle = sum(angles)/len(angles)

print(angle)

最佳答案

如果你不检测文本，尝试检测 2 个文本(上下)之间的空格。

(1) 最容易的方式。

对图像进行阈值查找文本(单词=1，单词=0。然后找到阈值框的中心点。中间点 x 和 y 应该是空白。

尝试旋转一条线(相同长度)，以中间点为中心，宽度恰好接触顶部和底部文本。具有最大非零像素(意味着线不与文本重叠)为 1 的结果应该是文本所在的角度。

(2)使用旧的人脸检测路由。在 N 旋转角度使用具有模板匹配的 harr 样模式。

所有 x, y , angle 的 For 循环

然后逐步细化。

例如，这是 harr 特征的角度 0 版本。通过模板匹配将其与图像对齐。然后对齐旋转的图案并添加到前一个角度模板匹配图像的顶部。连接所有模板匹配结果并运行 min-max 以找到最高返回

关于python - 如何校正和识别图像中的短文本，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/56277865/

25

4

0

文章推荐： python - 将 sqlite 与 keras 生成器一起使用

文章推荐： c# - Entity Framework LINQ 多对多查询

文章推荐： python - 我一直在尝试使用 pygame 每 20 秒生成一个新敌人

文章推荐： c# - 知道3点是否构成等边三角形

leaflet - 校正 Rayshader 的卫星图像覆盖
我试图通过叠加更新的(更详细的)卫星图像(我从 {leaflet} 包中获取)来改善 Rayshader 的外观，但叠加层不匹配与 3D 渲染。理想情况下，我正在寻找可以获取全局卫星图像的开源解决方
delphi - 如何将滚动条位置转换为 Gamma 校正？
我想构建一个由单个数字组成的常量数组(1..200)来制作一个“查找表”，以将值为 1 - 200 的滚动条的位置转换为用于对图像应用 Gamma 校正的值。第一个数组值的值在 7.0 - 9.9
opencv - Gamma 校正@幂律变换
我尝试对图像进行一些简单的 Gamma 校正。起初，我尝试使用 Matlab，然后将其应用于 opencv。但我得到不同的结果。下面是部分代码。代码哪里出错了？在matlab中: for i=1:r
c++ - PNG Gamma 校正
我使用 DirectXTex 库捕获 DX11 游戏的屏幕截图并将其保存到文件中。问题是当我将它保存为 jpeg 时效果很好，但如果我将它保存为 png 图像会变得非常明亮并被洗掉。我使用 Tweak
python - Gamma 校正，用于背景较浅的图像
我正在尝试使用以下代码检测图像中ID卡的边界。关键是我使用的 Gamma 值。我使用2或3的值(假设我希望卡在背景下突出显示)。使用背景较浅或与卡片颜色本身一样浅的照片时遇到问题。请看下面的图片..第
opencv - OpenCV 中的立体校准 + 校正
我正在进行立体视觉设置，机翼上方安装了 2 个摄像头。左摄像头向内倾斜几度，而右摄像头与机翼平行。所有可用图像 here 然后使用(剪切和粘贴，但不按原样编译) // performing stere
regex - 非确定性有限自动机 (NFA) 校正
我正在尝试解决有关 NFA 的问题。指令如下:字母{a, b, c}。 • L1 是最后一个字符与倒数第五个字符相同的所有字符串。例如，应该接受字符串 aaacbacbca，因为倒数第五个字符和最后一
c++ - qt中的图像 Gamma 校正
我尝试使用 qt 更改图像的 Gamma，但没有得到理想的结果。这是我的代码: QImage Filters::aply_filtre_gamma(QImage image){ // (std:
image-processing - Y'CbCr 空间中的 Gamma 校正
我需要对 Y'CbCr 空间中的图像进行 Gamma 校正，以便在图像中的饱和和饥饿区域中显示细节，我想知道是否需要调整色度子 channel ？我知道如果我让亮度 channel 像素挨饿，如果我
opencv - opencv hog.cpp中的 Gamma 校正
我不了解opencv中hog.cpp中的 Gamma 校正代码，我经历了一些链接here与opencv hog.cpp中的代码不匹配 Mat_ _lut(1, 256); const float* l
javascript - 如何使用 CSS3 滤镜模拟 Gamma 校正？
根据本页http://www.w3schools.com/cssref/css3_pr_filter.asp有对比度、亮度、色调、饱和度等。但没有明确访问 Gamma 。有没有办法用现有的 CSS3
python - 通过超几何分析对 p 值进行 Bonferroni 校正
我进行了超几何分析(使用 Python 脚本)来研究 GO-terms 在基因子集中的富集。我的输出示例如下: GO00001 1500 300 200 150 5.39198144708e-7
android - 如何使用 OpenCV 校正 RotatedRect 偏斜？
我使用 Opencv 编写了一个 Android 应用程序，我的图像处理算法需要对检测到的矩形进行正确的旋转，因此作为该过程的开始，我将最大的矩形检测为 RotatedRect。获取矩形的旋转角度
c++ - 图像 C++ 上有太多黑色区域的 OpenCV 校正
我正在使用 OpenCV 校准和校正立体声系统。我有一个眼睛会聚的立体相机，实际上我按以下顺序运行这些功能: for(int j=0; j < ChessBoard.numSquares; j++)
c++ - 使用 pow 进行 Gamma 校正
我会对图像使用 Gamma 校正。因此，我必须使用 G = 0.6 为源图像的每个像素强度赋值。我有问题，因为目标图像完全错误。当我从源图像中获取像素时，可能会遇到转换问题。这是我的代码: #incl
android - 在 android 中对图像进行 Gamma 校正
我正在构建一个 Android 应用程序，为用户提供一些图像处理功能。但在应用任何图像转换功能之前，我想进行 Gamma 校正以改善图像。我知道如何执行 Gamma 校正，但我不知道要使用什么 Gam
c++ - Intel UHD 630 上的默认帧缓冲区未进行 Gamma 校正
我在 Windows 10 上使用 SDL2 创建 OpenGL 上下文，但是当我尝试在 Intel UHD 630 上获取帧缓冲区附件颜色编码时，我收到了无效操作错误。在我的 Nvidia Gefo
image - 如果有 RGB 数据，如何处理 Gamma 校正
我有RGB数据和Gamma校正比例我可以用下面的来计算吗 R = pow(R, 1/Gamma) G = pow(G, 1/Gamma) B = pow(B, 1/Gamma) 或 Gamma 校正
c++ - OpenGL framebuffer blitting 在启用时是否考虑 Gamma 校正？
关闭。这个问题需要debugging details .它目前不接受答案。编辑问题以包含 desired behavior, a specific problem or error, and th
quicktime - 如何在 Snow Leopard 中从 QTKit 获取图像数据而无需进行颜色或 Gamma 校正？
自 Snow Leopard 以来，QTKit 现在从 QTMovies frameImageAtTime:withAttributes:error: 等函数返回颜色校正后的图像数据。给定未压缩的 A

首页

博学

6Ren·AI

商城

python - 如何校正和识别图像中的短文本