cluster-analysis - 哪种算法和超参数的哪种组合最适合对这些数据进行聚类？-6ren

cluster-analysis - 哪种算法和超参数的哪种组合最适合对这些数据进行聚类？

转载作者：行者123 更新时间：2023-12-04 15:06:07

26

4

我在学习非线性聚类算法时遇到了这个二维图。我想知道哪种聚类算法和超参数的组合可以很好地聚类这些数据。

Plot

就像人类将这 5 个尖峰聚集在一起一样。我希望我的算法能够做到这一点。
我尝试了 KMeans，但它只是水平或垂直聚类。我开始使用 GMM，但无法获得适合所需聚类的超参数。

最佳答案

如果它不起作用，请始终尝试首先改进预处理。 k-means 等算法对缩放非常敏感，因此需要谨慎选择。

GMM 显然是您的首选。可能值得尝试不同的工具。 R 的 Mclust 非常慢。 Sklearn 的 GMM 有时不稳定。 ELKI 入门有点难，但它的 EM 通常给我最好的结果。

除了 GMM，它可能值得一试 相关聚类 .这些算法假设有一些流形(例如，一条线)存在一个集群。示例包括 ORCLUS、LMCLUS、CASH、4C ……但在我看来，这些主要适用于合成玩具数据。

关于cluster-analysis - 哪种算法和超参数的哪种组合最适合对这些数据进行聚类？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/56395293/

26

4

0

文章推荐： perl - 如何检查 Perl 标量是否可以被视为子程序？

文章推荐： r - 有没有比 fread() 更快的方法来读取大数据？

文章推荐： angular - 如何使用 react 形式设置 Angular Material Chip Control

delphi - 如何访问Delphi中的基(超)类？
在C#中，我可以通过base关键字访问基类，在java中，我可以通过super关键字访问它。在delphi中如何做到这一点？假设我有以下代码: type TForm3 = class(TF
mysql - 用于数据库设计的抽象/超/子类结构
在这件事上我已经把头撞到墙上好几次了。所以我希望在正确的方向上得到一点帮助。我有一张 table ，上面有订单，一张 table 上有火车，一张 table 上有航类，一张 table 上有巴士。每
python - 如何初始化基(超)类？
在 Python 中，假设我有以下代码: class SuperClass(object): def __init__(self, x): self.x = x
ios - 超 View 边框正在切入 subview
我希望这个 subview 扩展到它的父 View 之外，但是父 View 的边框正在切入 subview 。有没有办法防止这种情况？ class TheView : UIView { let
具有峰值和平顶(超)高斯信号的 Python 曲线拟合问题
我有一个标准的高斯函数，看起来像这样: def gauss_fnc(x, amp, cen, sigma): return amp * np.exp(-(x - cen) ** 2 / (2
具有下界(超)类型的 Java 方法
例如，我有下一个类，带有有界类型参数: public class ItemContainer { void addItems(List items); } 在另一个带有参数的类中使用: pub
batch-file - 7zip 超 LZMA2 压缩
如何将此设置转换为命令？结果如下: // Manual Compression (see the image above) Compressed Size: 12,647,451 bytes //
java - Lombok @Wither/@With Inheritance(超/子类)
请建议在应用继承时如何使用@Wither/@With。我有一个抽象类Parent和具体的Child。 Child 应该是不可变的。将 @Wither 放在两者上会给我两个错误: 构造函数 Child
networking - 超 V : Network Adapter Drivers
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。这个问题似乎不是关于 a specific programming problem, a softwar
python - 超 HTTP2 自定义 SSLContext 错误
我正在尝试向服务器(虚拟托管)发出 HTTP2 请求，该服务器根据主机 header 值 (SNI) 提供 SSL 证书。 # conn = hyper.HTTP20Connection('h
java - 超 SQL (HSQLDB) : massive insert performance
我有一个应用程序，必须将大约 1300 万行、大约 10 个平均长度的字符串插入到嵌入式 HSQLDB 中。我一直在调整一些东西(批量大小、单线程/多线程、缓存/非缓存表、MVCC 事务、log_si
julia - 在 Julia 中，如何正确地对调用者提供的(超)类型的参数进行方法分派(dispatch)？
我想定义一个函数f(x, t::Type)根据 isa(x, t) 是否执行不同的行为.假设我想调用b1(x)如果是，b2(x)除此以外。我知道我可以像这样在运行时进行动态检查: function
c# - 超 V WMI : Import virtual machine and create snapshot
我正在使用 Hyper-V WMI Provider在 Hyper-V 中导入虚拟机，特别是使用 ImportVirtualSystemEx Msvm_VirtualSystemManagementS
c - 如何在(旧)opengl (2.4) 中按程序绘制(超/n-)立方体
这几个星期以来一直困扰着我，我没有结束对它的研究，因为我目前重载并且它让我落后于第一年的 CS (opengl) 大学类(class)，这首先让我研究了这个:如何只用一个 for 循环绘制立方体的所有
linux - 超 V 错误。同时运行 Windows Phone 模拟器和 VM (Windows 8)
我正在我的计算机(操作系统:Windows 8)上开发一个 WP8 应用程序。我需要安装一个 VM 才能拥有 linux。同时我需要使用我的 Windows Phone 模拟器。我下载了 VMWar

首页

博学

6Ren·AI

商城

cluster-analysis - 哪种算法和超参数的哪种组合最适合对这些数据进行聚类？