- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有一个大型数据集,我正在尝试使用 SOM 进行聚类分析。数据集巨大(约数十亿条记录),我不确定神经元的数量和 SOM 网格的大小应该从多少开始。任何有关估计神经元数量和网格大小的 Material 的指针将不胜感激。
谢谢!
最佳答案
引自som_make function documentation som工具箱的
It uses a heuristic formula of 'munits = 5*dlen^0.54321'. The 'mapsize' argument influences the final number of map units: a 'big' map has x4 the default number of map units and a 'small' map has x0.25 the default number of map units.
dlen 是数据集中的记录数
您还可以阅读经典的 WEBSOM,它解决了大型数据集的问题 http://www.cs.indiana.edu/~bmarkine/oral/self-organization-of-a.pdf http://websom.hut.fi/websom/doc/ps/Lagus04Infosci.pdf
请记住, map 大小也是一个参数,也是特定于应用程序的。也就是说,这取决于您想要对生成的集群执行什么操作。大型 map 会产生大量小但“紧凑”的簇(分配给每个簇的记录非常相似)。小 map 产生较少但更通用的集群。 “正确数量的簇”并不存在,尤其是在现实世界的数据集中。这完全取决于您想要检查数据集的详细信息。
关于machine-learning - Kohonen 自组织映射 : Determining the number of neurons and grid size,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19163214/
请帮助我完成我的期末作业。有讲师的一些问题 如何确定自组织图上的簇数? 如何确定最佳迭代次数自组织映射? 最佳答案 我不会做你的作业,但我会给你一些提示,希望它能让你开始: 集群算法数量 DS2L-S
关闭。这个问题不满足Stack Overflow guidelines .它目前不接受答案。 想改善这个问题吗?更新问题,使其成为 on-topic对于堆栈溢出。 6年前关闭。 Improve thi
SOM 的 Kohonen 算法说明了如何针对每个训练示例调整最佳响应神经元及其邻居的输入权重。 当谈到绘图时,我留下了( map 神经元的数量)-许多特征空间维度的向量。如何减少这一点以使二维图随处
我正在尝试使用 pymvpa2 SOM mapper 在 Python 中实现自组织映射。 它工作得很好,但如何保存生成的 SOM? h5save 对我不起作用,我开始想知道,是否可以创建一个空的 S
一般来说,仅使用实值向量的 Kohonen 映射/SOM 算法的实现是一项相对微不足道的任务。由于“权重更新”阶段,我想知道如何为文本字符串等非实值(即非标量)属性实现这样的算法。 假设有一组数据包含
是否可以用六边形绘制 SOM map (包 Kohonen) 作为基本形式而不是圆圈?现在不同的绘图 (计数、变化等)被绘制为带有白色环境的圆圈。 目的是创建类似于 Matlab SOM 工具箱的 S
我正在阅读 R-bloggers 上的这篇博文,我对代码的最后一部分感到困惑,无法弄清楚。 http://www.r-bloggers.com/self-organising-maps-for-cus
我不知道如何设置 map 中每个神经元的定位。这是一个神经元和 map : typedef struct _neuron { mfcc_frame *frames; char *nam
我有一个数据集,想通过 R 中的 Kohonen SOM 进行聚类。我想将聚类数量从 2 更改为 40,但我没有找到可以在聚类之前设置聚类数量的包,如下所示参数。 你能帮我找到合适的包或库或工具,我可
我喜欢在 Batch SOM 收敛时停止执行。我可以使用什么误差函数来确定收敛性? 最佳答案 我很确定你指的是成本函数而不是误差函数。 SOM 不需要误差函数(也不需要成本函数)。 在机器学习分类法的
我有一个大型数据集,我正在尝试使用 SOM 进行聚类分析。数据集巨大(约数十亿条记录),我不确定神经元的数量和 SOM 网格的大小应该从多少开始。任何有关估计神经元数量和网格大小的 Material
根据 Jeff Heaton 的《Introduction to Neural Networks with Java》,Kohonen 神经网络的输入必须是 -1 到 1 之间的值。 可以在事先已知范
我正在尝试针对我的 23 个样本的表达数据(约 500 个基因)运行一个受监督的自组织映射。23 个样本分为 4 组。我想获得这 4 个组中具有相似表达模式的基因图谱。 当使用Kohonen包的xyf
我正在尝试针对我的 23 个样本的表达数据(约 500 个基因)运行一个受监督的自组织映射。23 个样本分为 4 组。我想获得这 4 个组中具有相似表达模式的基因图谱。 当使用Kohonen包的xyf
我是一名优秀的程序员,十分优秀!