- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
根据我对 DBSCAN 的理解,您可以指定 epsilon,例如 100 米,并且 — 因为 DBSCAN 考虑了密度可达性 而不 < em>direct density-reachability 寻找簇时——最终得到一个簇,其中任意两点之间的最大距离大于 100 米。在更极端的可能性中,您似乎可以将 epsilon 设置为 100 米并最终得到 1 公里的集群: see [2][6] in this array of images from scikit learn有关何时可能发生的示例。 (我非常愿意被告知我是个彻头彻尾的白痴,如果这就是这里发生的事情,我会误解 DBSCAN。)
是否有像 DBSCAN 这样基于密度的算法,但考虑了集群中任意两点之间最大距离的某种阈值?
最佳答案
DBSCAN 确实没有对集群施加总大小限制。
epsilon 值最好解释为分隔两个簇的间隙大小(最多包含 minpts-1 个对象)。
我相信,实际上您甚至不是在寻找聚类:聚类是发现数据结构的任务。结构可以更简单(如k-means)或复杂(如层次聚类和k-means发现的任意形状的聚类)。
您可能正在寻找 vector quantization - 将数据集减少为较小的代表集 - 或 set cover - 寻找给定集合的最佳覆盖 - 而不是。
但是,我也觉得您并不确定自己需要什么以及为什么。
DBSCAN 的一个优势在于它具有密度连通分量形式的结构的数学定义。这是一个强大且(除了一些罕见的边界情况)定义明确的数学概念,DBSCAN 算法是发现这种结构的最有效算法。
Direct 然而,密度可达性并未定义有用的(分区)结构。它只是不会将数据分成不相交的分区。
如果您不需要这种强大的结构(即您不像“结构发现”那样进行聚类,而只想像矢量量化那样压缩数据),您可以使用“冠层预聚类”一试。它可以看作是为聚类设计的预处理步骤。本质上,它类似于 DBSCAN,只是它使用两个 epsilon 值,并且不保证结构在任何方面都是最优的,而是在很大程度上取决于数据的顺序。如果您随后对其进行适当的预处理,它仍然有用。除非您处于分布式环境中,否则树冠预聚类至少与完整的 DBSCAN 运行一样昂贵。由于需求松散(特别是“集群”可能重叠,对象应该属于多个“集群”),更容易并行化。
哦,您也可能只是在寻找完全链接层次聚类。如果您在所需高度处切割树状图,则生成的簇在任何两个对象之间都应具有所需的最大距离。唯一的问题是层次聚类通常是 O(n^3)
,即它不能扩展到大型数据集。 DBSCAN 在良好的实现中以 O(n log n)
运行(具有索引支持)。
关于python - dbscan - 设置最大集群跨度限制,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18547147/
这个问题已经有答案了: Is there any way to accept only numeric values in a JTextField? (20 个回答) It's possible i
我使用戴尔 XPS M1710。笔记本电脑的盖子、侧面扬声器和前置扬声器都有灯(3 组灯可以单独调节)和鼠标垫下方的灯。在 BIOS 中,我可以更改这些灯的颜色,至少是每个组。另外,我可以在鼠标垫下打
我知道我可以使用 在 iOS 5 中打开设置应用 [[UIApplication sharedApplication] openURL:[NSURL URLWithString:@"prefs://"
我有一个 Django 应用程序,我正在尝试为其设置文档。目录结构如下: - doc - project | - manage.py 我已经设置了路径以便 Sphinx 可以看到东西,但是当我尝试使用
我正在使用 768mb ram 运行 centos 5.5。我一直在日志中获取 server reached MaxClients setting, consider raising the MaxC
我在具有以下配置的服务器内运行了 Drupal 安装: StartServers 5 MinSpareServers 5 MaxSpareServers 15 MaxClien
是否可以使用 Microsoft.Web.Administration 包为给定的 location 配置 asp 设置? 我想以编程方式将以下部分添加到本地 IIS applicationHost.
我一直在阅读为 kube-proxy 提供参数的文档,但没有解释应该如何使用这些参数。我使用 az aks create 创建我的集群使用 azure-cli 程序,然后我获得凭据并使用 kubect
我想知道与在 PHP 中使用 setcookie() 函数相比,在客户端通过 JavaScript 设置一些 cookie 是否有任何明显的优势?我能想到的唯一原因是减少一些网络流量(第一次)。但不是
我有一个按钮可以将 body class 设置为 .blackout 我正在使用 js-cookie设置cookie,下面的代码与我的按钮相关联。 $('#boToggle').on('click'
我有一堆自定义的 HTML div。我将其中的 3 存储在具有 slide 类的 div 中。然后,我使用该幻灯片类调用 slick 函数并应用如下设置: $('.slide').slick({
我正在创建一个应该在 Windows 8(桌面)上运行的应用 我需要: 允许用户使用我的应用启动“文件历史记录”。我需要找到打开“文件历史记录”的命令行。 我需要能够显示“文件历史记录”的当前设置。
我刚买了一台新的 MacBook Pro,并尝试在系统中设置 RVM。我安装了 RVM 并将默认设置为 ➜ rvm list default Default Ruby (for new shells)
由于有关 Firestore 中时间戳行为即将发生变化的警告,我正在尝试更改我的应用的初始化代码。 The behavior for Date objects stored in Firestore
在 ICS 中,网络 -> 数据使用设置屏幕中现在有“限制后台数据”设置。 有没有办法以编程方式为我的应用程序设置“限制后台数据”? 或 有没有办法为我的应用程序调出具有选项的“数据使用”设置? 最佳
我正在尝试使用 NextJS 应用程序设置 Jest,目前在 jest.config.js : module.exports = { testPathIgnorePatterns: ["/.n
我最近升级到 FlashDevelop 4,这当然已经将我之前的所有设置恢复到原来的状态。 我遇到的问题是我无法在新设置窗口的哪个位置找到关闭它在方括号、大括号等之前插入的自动空格的选项。 即它会自动
有没有办法以编程方式访问 iPhone/iPod touch 设置? 谢谢。比兰奇 最佳答案 大多数用户设置可以通过读取存储在 /User/Library/Preferences/ 中的属性列表来访问
删除某些值时,我需要选择哪些设置来维护有序队列。我创建了带有自动增量和主键的 id 的表。当我第一次插入值时,没问题。就像 1,2,3,4,5... 当删除某些值时,顺序会发生变化,例如 1,5,3.
我正在尝试设置示例 Symfony2 项目,如此处所示 http://symfony.com/doc/current/quick_tour/the_big_picture.html 在访问 confi
我是一名优秀的程序员,十分优秀!