- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我正在从事一个光学字符识别项目,我正在尝试创建一个程序来识别图像中的字母。我正在按照 Mathworks ( Digit Classification) 上的教程进行操作。在他们的示例中,他们的训练图像已经分开。不幸的是,我得到的训练图像在一个文件中包含数百个字母。
这是一个示例:
我需要一种有效的方法来将每个单独的字母分割成图像,因此我将有一个 26Xn 数组,其中 26 是字母表中的每个字母,n 是包含单个字母的 n 个图像数据变量。从每个训练图像中手动分割字母或尝试按指定长度分割字母将非常乏味,因为字母之间的间隔并不总是相等的。
有谁知道 MATLAB 函数或一种简单的方法,我可以通过这种方法识别每个连续的白色对象的高度和长度,并将所有带有黑色背景的单个白色对象存储在上述 26Xn 数组中(或至少存储在某种类型的数组中以便我稍后可以将它处理成 26xn 数组)?
最佳答案
如果你想提取图像中的每一个单独的字符,你可以很容易地使用 regionprops
来做到这一点。 .只需使用 BoundingBox
属性来提取每个字符周围的边界框。执行此操作后,我们可以将每个字符放入 cell
数组中以供进一步处理。如果您想将其存储到 26 x N
数组中,您需要识别每个字母的第一个字母,以便您可以选择字母应该进入第一维的插槽。因为你想先分割出字符,所以我们会专注于此。因此,让我们将图像加载到 MATLAB 中。请注意,原始图像是 GIF 格式的,当我将其加载到我的计算机上时……它看起来很乱。我已将图像重新保存为 PNG,如下所示:
让我们将其读入 MATLAB:
im = imread('http://i.stack.imgur.com/q7cnA.png');
现在,您可能会注意到某些字母之间存在一些不连续性。我们可以做的是进行形态学开运算来缩小这些差距。但是,我们不会使用此图像来提取实际字符。我们只使用这些来获取字母的边界框:
se = strel('square', 7);
im_close = imclose(im, se);
现在,您可以像这样调用 regionprops
来查找图像中的所有边界框(在应用形态学之后):
s = regionprops(im_close, 'BoundingBox');
s
中返回的是一个结构,该结构中的每个元素都包含一个边界框,该边界框封装了在图像中检测到的对象。在我们的例子中,这是一个单一的角色。每个对象的 BoundingBox
属性是一个 4 元素数组,格式如下:
[x y w h]
(x,y)
是边界框左上角的列和行坐标,w
和 h
是边界框的宽度和高度。我们接下来要做的是创建一个 4 列矩阵,将所有这些边界框属性封装在一起,其中每一行表示一个边界框:
bb = round(reshape([s.BoundingBox], 4, []).');
有必要对值进行四舍五入,因为如果您想从图像中提取字母,我们必须在整数坐标中执行此操作,因为这是自然定义图像的方式。如果您想很好地说明这些边界框,下面的代码将在我们检测到的每个字符周围绘制一个红色框:
imshow(im);
for idx = 1 : numel(s)
rectangle('Position', bb(idx,:), 'edgecolor', 'red');
end
这是我们得到的:
最后的工作是提取所有字符并将它们放入cell
数组中。我正在使用 cell
数组,因为字符大小不均匀,因此将其放入 cell
数组将适应不同的大小。因此,只需遍历我们拥有的每个边界框,然后提取像素边界框以获取每个字符并将其放入元胞数组中。因此:
chars = cell(1, numel(s));
for idx = 1 : numel(s)
chars{idx} = im(bb(idx,2):bb(idx,2)+bb(idx,4)-1, bb(idx,1):bb(idx,1)+bb(idx,3)-1);
end
如果你想要一个字符,只需执行 ch = chars{idx};
其中 idx
是从 1 到我们拥有的字符数之间的任意数字。您还可以通过 imshow(ch);
希望这足以让您入门。祝你好运!
关于MATLAB:从二进制图像中分割单个字母,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26645067/
实际上我只需要用JAVA编写一个简单的程序来将MySQL INSERTS行转换为CSV文件(每个mysql表等于一个CSV文件) 在JAVA中使用正则表达式是最好的解决方案吗? 我的主要问题是如何正确
我有一个 txt 文件,其格式为: Key:value Key:value Key:value ... 我想将所有键及其值放入我创建的 hashMap 中。如何让 FileReader(file) 或
已关闭。此问题不符合Stack Overflow guidelines 。目前不接受答案。 要求提供代码的问题必须表现出对所解决问题的最低限度的了解。包括尝试的解决方案、为什么它们不起作用以及预期结果
我每周都会从我的主机下载数据库的备份。它生成一个 .sql 文件,当前大小约为 800mb。此 .sql 文件包含 44 个表。 有什么方法可以通过某些软件将 .sql 文件与所有表分开,以便单独导出
在 iOS 4.0 及更高版本中,有没有一种方法可以在不将整个图像加载到内存的情况下对 CGImage 进行分割?我试图做的是*以编程方式*分割图像,以便在使用大图像的 CATiledLayer 应用
我的 .split() 函数有问题,我有以下字符串: var imageUrl = "Images\Products\randomImage.jpg"; 我想用字符“\”分割,但是,这种情况发生了:
是否可以使用正则表达式将字符串拆分两次?例如,假设我有字符串: example=email@address.com|fname|lname 如何拆分结果为: email@address.com,fna
我正在寻找一种在线程系统(主从)中使用数组的解决方案,它允许我通过用户输入在多个线程上划分矩阵的计算,并将其通过 1 个主线程引导到多个从属线程,这些从属线程计算矩阵的 1 个字段。 我尝试运用我的知
我建立了一个系统来分割包含手写符号的二值图像并对它们进行分类(专门用于音乐)。我知道有商业应用程序可以执行此操作,但这是我尝试将其作为一个项目从头开始。 为了简单起见,假设我的整个图像中有两个元素:
我正在尝试找到一种可接受的复杂性的有效方法 检测图像中的对象,以便将其与周围环境隔离 将该对象分割成它的子部分并标记它们,这样我就可以随意获取它们 我进入图像处理世界已经 3 周了,我已经阅读了很多算
我有一组3D 空间中的点。下图是一个示例: 我想把这些点变成一个面。我只知道点的 X、Y 和 Z 值。例如,查看下图,它显示了从 3D 空间中的点生成的人脸网格。 我在谷歌上搜索了很多,但我找到的是一
我有一个字符串 String placeStr="place1*place2*place3"我想获取包含 place1、place2、place3 的数组,如下所示: String[] places=
我在 Python 中有一个类似于 google.com 的字符串,我想将其分成两部分:google 和 .com。问题是我有一个 URL,例如 subdomain.google.com,我想将其拆分
朋友需要对一个pdf文件进行分割,在网上查了查发现这个pypdf2可以完成这些操作,所以就研究了下这个库,并做一些记录。首先pypdf2是python3版本的,在之前的2版本有一个对应pypdf库。
伙计们,这是一个难以解决的问题,因为它涉及很多硬件细节,所以我想把它放到 EE.SE,但它的主要重点是编程,所以我决定坚持在这里。 我最近怀旧(以及渴望回到 CPU 内在函数),所以我决定自制一个 8
给定 haskell 中的排序列表,我如何获得分段列表,其中连续数字位于同一列表中。例如,如果我有一个排序列表 [1,2,3,4,7,8,10,12,13,15] 结果将是 [[1,2,3 ,4],[
如果我添加三个分割 View ,如下图所示,第三个分割 View (称为 splitView-3)将自动为该分割 View 中的自定义 View 生成约束,例如 customview1 的 Heigh
关闭。此题需要details or clarity 。目前不接受答案。 想要改进这个问题吗?通过 editing this post 添加详细信息并澄清问题. 已关闭 6 年前。 Improve th
如何为馈送给映射器的文件的每一行提供相同文件的拆分? 基本上我想做的是 for each line in file-split { for each line in file{
带有Snappy压缩功能的ORC文件是否可拆分成条形? 据我所知,Snappy Compressed File是不可拆分的。 但我在博客中读到,快速压缩的文件可以在 strip 上拆分。 真的吗? 最
我是一名优秀的程序员,十分优秀!