gpt4 book ai didi

opencv - 计算机视觉 : How to split horizontally an image by the line with least entropy?

转载 作者:太空宇宙 更新时间:2023-11-03 20:42:29 25 4
gpt4 key购买 nike

我的图像有一个非白色区域(例如段落但不处理 OCR)。这些区域之间的空间有些规则,观看图像的人将能够看到这些区域之间有空白。

我打算做的是找到所有区域的顶角和底角,从底角开始到下一个区域的顶角,取每条水平线的熵,以及具有最低值的线并返回该线的 Y位置。 enter image description here

[region] <--- maximum corner coordinates identified
[line with lowest entropy] <--- return Y position starting from above region's bottom corner's Y coordinate.
[region]<--- stop at Y coordinate of this region's top corner.

我打算做的是裁剪掉这些区域。

我想到的另一种方法是使用直方图来识别最低点并以某种方式找到最低柱的位置。

最佳答案

我不确定这是否是您要查找的内容(我不确定您要查找的内容),所以如果我错了请写下更多详细信息,我会尝试更新我的答案。现在我认为您正在寻找最适合分割纸张的白色区域,因为您没有切掉任何重要的东西。

最容易实现的解决方案是计算每一行和下一行的总和,并检查这些值的差值是否为 0(或其他一些小值)。这是一个简单的代码:

Mat m = imread(pathToFile);
cvtColor(m, m, CV_BGR2GRAY); //just to make sure
for (int i = 0; i < m.rows - 1; i++)
{
Scalar s = sum(Mat(m, Rect(0, i, m.cols - 1, 1)));
Scalar s2 = sum(Mat(m, Rect(0, i + 1, m.cols - 1, 1)));
Scalar s3 = s - s2;
if ((int)s3[0] == 0)
printf("Empty line: %d\n", i);
}

事实上 - 你还应该检查这条线是否是白色的,或者你可能刚刚发现了 2 条非常相似的非白色线 - 所以只需在这段代码中添加一些测试,比如 if ((int)s[0] < someValue) {//it's ok} else {//it's bad} .当然,这不是非常有效的解决方案,因为您必须计算每行(几乎每行)的总和两次,这是浪费时间。更快的解决方案是记住变量中行的总和,或者如果您想稍后使用它们,甚至可以将所有总和放在向量/数组/等中。

最有效的计算方法可能是使用 integral images - 计算整个图像的总和,然后减去 i 的最后一个元素从 i+1 的最后一个元素开始的行排。当然,积分图像是在 openCV 中实现的 - see here

关于opencv - 计算机视觉 : How to split horizontally an image by the line with least entropy?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15954322/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com