- Java 双重比较
- java - 比较器与 Apache BeanComparator
- Objective-C 完成 block 导致额外的方法调用?
- database - RESTful URI 是否应该公开数据库主键?
首先我们生成二进制文件通过在其 80% 的阈值处对给定图像进行阈值处理强度并反转生成的图像。在二进制图像中白色像素表示字符、 、图形和线条等。模式提取的第一步是定位矩形称为“矩形”的区域。矩形是松散的矩形区域连接的白色像素 1 , 包含一定的逻辑文档的一部分。我们考虑了简单的 8 邻域连接性和执行的连接组件(轮廓)二值图像的分析导致分割文本组件。对于算法的下一部分,我们使用轮廓的最小边界矩形。这些长方形然后使用从上到下和从左到右的顺序排序最左上角的二维点信息。更小基于假设丢弃连接模式它们可能是由于依赖于图像的噪声而产生的采集系统,不以任何方式有助于最终布局。标点符号也被忽略了较小的尺寸标准,例如逗号,句号等。在这个级别我们还根据边界的高度分离字体使用 avgh(平均高度)作为阈值的矩形。两个阈值用于将字体分为三类 - 小号、普通号和大。
can you help me translate this theory into opencv source code or give me any related link for this, im currently working with document image analyzing for my thesis ....
最佳答案
我知道这是一个迟到的回复。但我认为 future 的人可以从中得到帮助。
下面是我认为我从上面的段落中理解的答案(所有代码都在 OpenCV-Python v 2.4-beta 中):
我将其作为输入图像。为了便于理解,这是一个简单的图像。
First we generate the binary image of the give image by thresholding it at 80% of its intensity and inverting the resulting image.
import cv2
import numpy as np
img = cv2.imread('doc4.png')
gray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)
ret,thresh = cv2.threshold(gray,0.8*gray.max(),255,1)
contours, hier = cv2.findContours(thresh,cv2.RETR_EXTERNAL,cv2.CHAIN_APPROX_SIMPLE)
阈值图像:
We considered simple 8-neighborhood connectivity and performed connected component (contour) analysis of the binary image leading to the segmentation of the textual components.
它只是OpenCV中的轮廓查找,也称为connected-component labelling.它选择图像中的所有白色 Blob (组件)。
contours, hier = cv2.findContours(thresh,cv2.RETR_EXTERNAL,cv2.CHAIN_APPROX_SIMPLE)
轮廓:
For next part of algorithm we use the minimum bounding rectangle of contours.
现在我们在每个检测到的轮廓周围找到边界矩形。然后去掉小面积的轮廓,去掉逗号等。看语句:
Smaller connected patterns were discarded based on the assumption that they may have originated due to noise dependent on image acquisition system and does not in any way contribute to the final layout. Also punctuation marks were neglected using smaller size criterion e.g. comma, full-stop etc.
我们还找到了平均高度,avgh
.
height = 0
num = 0
letters = []
ht = []
for (i,cnt) in enumerate(contours):
(x,y,w,h) = cv2.boundingRect(cnt)
if w*h<200:
cv2.drawContours(thresh2,[cnt],0,(0,0,0),-1)
else:
cv2.rectangle(thresh2,(x,y),(x+w,y+h),(0,255,0),1)
height = height + h
num = num + 1
letters.append(cnt)
ht.append(h)
avgh = height/num
所以在这之后所有逗号等都被删除,并在选定的周围绘制绿色矩形:
At this level we also segregate the fonts based on the height of the bounding rect using avgh (average height) as threshold. Two thresholds are used to classify fonts into three categories - small, normal and large
(根据段落中给定的方程式)。
平均高度,avgh,这里得到的是40,所以一个字母是small
如果高度小于 26.66(即 40x2/3),normal
if 26.66large if height>60.但是在给定的图像中,所有高度都在 (28,58) 之间,所以都是正常的。所以你看不出区别。
所以我只是做了一个小修改,以便轻松地可视化它:如果 height<30 则小,如果 3050 则正常。
for (cnt,h) in zip(letters,ht):
print h
if h<=30:
cv2.drawContours(thresh2,[cnt],0,(255,0,0),-1)
elif 30 < h <= 50:
cv2.drawContours(thresh2,[cnt],0,(0,255,0),-1)
else:
cv2.drawContours(thresh2,[cnt],0,(0,0,255),-1)
cv2.imshow('img',thresh2)
cv2.waitKey(0)
cv2.destroyAllWindows()
现在您得到的结果是将字母分类为小号、普通号、大号:
These rectangles were then sorted top-to-bottom and left-to-right order, using 2D point information of leftmost-topmost corner.
这部分我已经省略了。它只是根据最左上角对所有边界矩形进行排序。
关于c++ - OpenCV 中文档的模式提取层,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8655085/
我正在尝试从我的系统中完全删除 opencv。我试图学习 ROS,而在教程中我遇到了一个问题。创建空工作区后,我调用catkin_make 它给出了一个常见错误,我在 answers.ros 中搜索并
我在尝试逐步转移对warpAffine的调用时遇到崩溃(不是异常): void rotateImage( const Mat& source, double degree, Mat& output )
如何处理opencv gpu异常?是否有用于opencvgpu异常处理的特定错误代码集api? 我尝试了很多搜索,但只有1个错误代码,即CV_GpuNotSupported。 请帮帮我。 最佳答案 虽
笔记 我是 OpenCV(或计算机视觉)的新手,所以告诉我搜索查询会很有帮助! 我想问什么 我想编写一个从图片中提取名片的程序。 我能够提取粗略的轮廓,但反射光会变成噪点,我无法提取准确的轮廓。请告诉
我想根据像素的某个阈值将Mono16类型的Mat转换为二进制图像。我尝试使用以下内容: 阈值(img,ret,0.1,1,CV_THRESH_BINARY); 尝试编译时,出现make错误,提示: 错
我对使用GPU加速的OpenCV中的卷积函数有疑问。 使用GPU的卷积速度大约快3.5 运行时: convolve(src_32F, kernel, cresult, false, cbuffer);
我正在尝试使用非对称圆圈网格执行相机校准。 我通常找不到适合CirclesGridFinder的文档,尤其是findHoles()函数的文档。 如果您有关于此功能如何工作以及其参数含义的信息,将不胜感
在计算机上绘图和在 OpenCV 的投影仪上投影之间有什么区别吗? 一种选择是投影显示所有内容的计算机屏幕。但也许也有这样的选择,即在投影仪上精确地绘制和投影图像,仅使用计算机作为计算机器。如果我能做
我将Processing(processing.org)用于需要人脸跟踪的项目。现在的问题是由于for循环,程序将耗尽内存。我想停止循环或至少解决内存不足的问题。这是代码。 import hyperm
我有下面的代码: // Image Processing.cpp : Defines the entry point for the console application. // //Save
我正在为某些项目使用opencv。并有应解决的任务。 任务很简单。我有一张主图片,并且有一个模板,而不是将主图片与模板进行比较。我使用matchTemplate()函数。我只是好奇一下。 在文档中,我
我正在尝试使用以下命令创建级联分类器: haartraining -data haarcascade -vec samples.vec -bg negatives.dat -nstages 20 -n
我试图使用OpenCV检测黑色图像中一组形状的颜色,为此我使用了Canny检测。但是,颜色输出总是返回为黑色。 std::vector > Asteroids::DetectPoints(const
我正在尝试使用OpenCv 2.4.5从边缘查找渐变方向,但是我在使用cvSobel()时遇到问题,以下是错误消息和我的代码。我在某处读到它可能是由于浮点(??)之间的转换,但我不知道如何解决它。有帮
我正在尝试构建循环关闭算法,但是在开始开发之前,我想测试哪种功能描述符在真实数据集上效果更好。 我有两个在两个方向拍摄的走廊图像,一个进入房间,另一个离开同一个房间。因此它们代表相同的场景,但具有2个
有没有一种方法可以比较直方图,但例如要排除白色,因此白色不会影响比较。 最佳答案 白色像素有 饱和度 , S = 0 .因此,在创建直方图时很容易从计数中删除白色像素。请执行下列操作: 从 BGR 转
就像本主题的标题一样,如何在OpenCV中确定图像的特定像素(灰度或彩色)是否饱和(例如,亮度过高)? 先感谢您。 最佳答案 根据定义,饱和像素是指与强度(即灰度值或颜色分量之一)等于255相关联的像
我是OpenCV的新用户,正在从事大学项目。程序会获取输入图像,对其进行综合模糊处理,然后对其进行模糊处理。当对合成模糊图像进行反卷积时,会生成边界伪像,因为...好吧,到目前为止,我还没有实现边界条
我想知道OpenCV是haar特征还是lbp是在多尺度搜索过程中缩放图像还是像论文中提到的那样缩放特征本身? 编辑:事实证明,检测器可以缩放图像,而不是功能。有人知道为什么吗?通过缩放功能可以更快。
我在openCv中使用SVM.train命令(已定义了适当的参数)。接下来,我要使用我的算法进行分类,而不是使用svm.predict。 可能吗?我可以访问训练时生成的支持 vector 吗?如果是这
我是一名优秀的程序员,十分优秀!