- mongodb - 在 MongoDB mapreduce 中,如何展平值对象?
- javascript - 对象传播与 Object.assign
- html - 输入类型 ="submit"Vs 按钮标签它们可以互换吗?
- sql - 使用 MongoDB 而不是 MS SQL Server 的优缺点
作为一项自我发展的练习,我想开发一种简单的分类算法,在给定Dilbert卡通的特定单元格的情况下,能够识别出卡通中存在哪些字符(Dilbert,PHB,Ratbert等)。
我认为最好的方法是(1)对图像应用某种算法,将其转换为一组特征;(2)使用训练集和许多可能的机器学习算法中的一种来关联存在性/在单元格中没有某些具有特定特征的特征。
因此,我的问题是-(a)这是正确的方法吗,(b)由于要测试许多分类算法和ML算法,找到正确方法的最佳方法是什么,以及(c)您将开始使用哪种算法假设我们实质上是对卡通进行分类练习。
最佳答案
因此,我认为您的第一步是正确的(将某种算法应用于图像,将其转换为一组功能)。
这个项目比大多数ML问题更具挑战性,因为实际上您必须从原始数据(组成卡通的各个帧)创建训练数据集。例如,抓取一个框架,在该框架中标识两个字符,Dilbert和带角的字符(我相信Dilbert的老板,不知道他的名字),从该框架中提取这两个字符,并附加到每个适当的类标签上(例如,Dlibert为“1”)。
步骤1
为了从组成Dilbert卡通的每个帧中提取单个字符,我建议每个帧的频谱分解。如果您不熟悉此技术,则其本质只是一个本征向量反压缩。
如果您喜欢python(或R,因为您可以使用像RPy这样的python-to-R绑定(bind)),那么我强烈建议您看看sklearn。特别是,这个出色的库(最初是在SciPy scikits项目的框架下开发的,因此使用NumPy + SciPy进行矩阵计算)具有几种图像分割算法,其中一种基于spectral clustering。对于项目的这一步,您很可能希望查看这两个scikits.learn模块。
关于python - 开发Dilbert卡通图像分类算法的一般方法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8108550/
我不明白显示映射到 OpenGL 三角形的 Sprite 的概念。 如果 OpenGL ES 只绘制三角形和点,如何显示/映射非三角形形状? 为什么映射到三角形的形状不会变形? 解释一下: 在我看来,
我是一名优秀的程序员,十分优秀!