gpt4 book ai didi

java - 通过统计灰度值 (Java) 自动裁剪扫描图像的黑色边框

转载 作者:塔克拉玛干 更新时间:2023-11-02 08:19:40 25 4
gpt4 key购买 nike

我正在编写一段代码来自动检测扫描图像上的黑色噪声边界并将其裁剪掉。我的算法基于 2 个变量:灰度平均值(行/列中像素的)和位置(图像中行/列的)。

灰色均值
图像是灰度的:这意味着任何像素的灰度值都在 0(黑色)、255(白色)范围内。
对于每一行/列的像素,我估计该行/列中所有像素的平均灰度值。
如果结果是黑色的,则当前行/列是要切断的边框的一部分。

位置
位置是图像左上角一行/列的像素距离。

看看下面的图片以获得更好的想法。
扫描图像的缩略图:
Thumbnail of a scanned image
结果图表:
Resulting char

通过查看图表,很容易估计裁剪点的位置,因为以下规则:大多数样本在白色窄范围 (150-200) 内,这是实际纸张,然后在尾部有一个快速变化为暗值。
这些快速变化是裁剪点(另请注意,在尾部的真正末端,仍有几个像素 x 为白色,但这种情况很少发生)。

我想自动完成,有什么统计数据可以帮助我吗?
PS:我是一名计算机工程师,我研究过一些统计数据,但是......太多年前了!!

在最好的情况下,代码应该适用于任何受黑边问题影响的扫描图像,但是,说真的,我会很满意让它适用于这些示例:
https://docs.google.com/folder/d/0B8ubCWBwsuOON3d1VVo4Z1AxWDA/edit

最佳答案

预处理图像使统计工作更容易。对于您的情况,带有宽水平线的形态闭合后跟 Otsu 阈值(统计上最优)使任务变得容易得多。形态开口在这里很有趣,因为它会特别使纸张区域更亮。你有两个边界区域模糊的例子,即它也包含浅色部分,但这并不会使这一步变得无用。之后就只剩下按列和按行求和,根据均值和标准差划定边界了。如果该值低于 mean - x*stddev,则它在论文之外。通过这种方式,您可以定义用于裁剪图像的纸张的左上角和右下角。定义此类角点的最简单方法是向前和向后线性遍历找到的和,在不满足先前条件时停止。

对于您的图像,x 在 [-1.5, -1] 范围内有效(以及其他图像,我在那里测试过)。我将关闭运算符的水平线大小固定为 101 点。以下是结果(如果需要进行比较,可以包括角坐标):

enter image description here enter image description here

enter image description here enter image description here

问题,正如已经指出的那样,其中一些图像还包含白色边框,就像下一个案例(与纸张相连)一样。为了解决这个问题,在图像是二进制图像之后考虑应用形态学开口,因为这有望断开组件。你可以使用一个大的结构元素,我使用了 51 x 51 的尺寸之一,这对于你的图像尺寸来说并不是那么大。主要限制是您正在使用的库的实现,因为如果实现不好,这可能会变慢(具体来说,scipy 没有快速实现)。之后,只保留最大的组件并照常进行。

enter image description here enter image description here

示例代码:

import sys
import numpy
import cv2 as cv
from PIL import Image, ImageOps, ImageDraw
from scipy.ndimage import morphology, label


img = ImageOps.grayscale(Image.open(sys.argv[1]))
im = numpy.array(img, dtype=numpy.uint8)

im = morphology.grey_closing(img, (1, 101))
t, im = cv.threshold(im, 0, 1, cv.THRESH_OTSU)

# "Clean noise".
im = morphology.grey_opening(im, (51, 51))
# Keep largest component.
lbl, ncc = label(im)
largest = 0, 0
for i in range(1, ncc + 1):
size = len(numpy.where(lbl == i)[0])
if size > largest[1]:
largest = i, size
for i in range(1, ncc + 1):
if i == largest[0]:
continue
im[lbl == i] = 0


col_sum = numpy.sum(im, axis=0)
row_sum = numpy.sum(im, axis=1)
col_mean, col_std = col_sum.mean(), col_sum.std()
row_mean, row_std = row_sum.mean(), row_sum.std()

row_standard = (row_sum - row_mean) / row_std
col_standard = (col_sum - col_mean) / col_std

def end_points(s, std_below_mean=-1.5):
i, j = 0, len(s) - 1
for i, rs in enumerate(s):
if rs > std_below_mean:
break
for j in xrange(len(s) - 1, i, -1):
if s[j] > std_below_mean:
break
return (i, j)

# Bounding rectangle.
x1, x2 = end_points(col_standard)
y1, y2 = end_points(row_standard)

#img.crop((x1, y1, x2, y2)).save(sys.argv[2]) # Crop.
result = img.convert('RGB')
draw = ImageDraw.Draw(result)
draw.line((x1, y1, x2, y1, x2, y2, x1, y2, x1, y1),
fill=(0, 255, 255), width=15)
result.save(sys.argv[2]) # Save with the bounding rectangle.

关于java - 通过统计灰度值 (Java) 自动裁剪扫描图像的黑色边框,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14296051/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com