- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
假设我有一个矩阵A
,其大小为2000*1000 double
。然后我申请Matlab 将函数“kmeans”
构建到矩阵A
。
k = 8;
[idx,C] = kmeans(A, k, 'Distance', 'cosine');
我得到C = 8*1000 double
; idx = 2000*1 double
,取值范围为1到8;根据文档,C
返回 k-by-p (8 by 1000)
矩阵中的 k 个簇质心位置。 idx 返回一个包含每个观测值的聚类索引的 n×1 向量。我的问题是:
1)我不知道如何理解C
,质心位置。位置应该表示为 (x,y)
,对吧?如何正确理解矩阵C
?
2) 最终中心c1, c2,...,ck
是什么?它们只是值(value)或位置吗?
3)对于每个簇,如果我只想得到最接近这个簇中心的向量,如何计算和获取?
谢谢!
最佳答案
在回答这三个部分之前,我将先解释一下 MATLAB 的 k 均值解释 ( http://www.mathworks.com/help/stats/kmeans.html ) 中使用的语法。
A
是您的数据矩阵(在链接中表示为 X
)。有 n
行(在本例中为 2000),代表您拥有的观察/数据点的数量。还有 p
列(在本例中为 1000),表示每个数据点具有的“特征”数量。例如,如果您的数据由 2D 点组成,则 p
将等于 2。k
是要将数据分组到的簇数。根据您提供的 C
维度,k
必须为 8。现在我将回答三个部分:
C
矩阵的维度为 k x p
。每行代表一个质心。质心位置根本不必是 (x, y)。质心位置的尺寸等于p
。换句话说,如果有 2D 点,则可以将质心绘制为 (x, y)。如果您有 3D 点,您可以将质心绘制为 (x, y, z)。由于 A
中的每个数据点都有 1000 个特征,因此您的质心有 1000 个维度。A
是坐标点,您当然可以将质心表示为位置。然而,我们可以更普遍地看待它。如果您有一个聚类质心 i
以及与该质心分组的数据点 v
,则质心将表示与其聚类中的数据点最相似的数据点。希望这是有道理的,如有必要,我可以给出更清晰的解释。k-means 方法实际上为我们提供了实现这一目标的好方法。该函数实际上有 4 个可能的输出,但我将重点关注第 4 个,我将其称为 D
:
[idx,C,sumd,D] = kmeans(A, k, 'Distance', 'cosine');
D
的尺寸为 n x k
。对于数据点 i
,D
矩阵中的行 i
给出了从该点到每个质心的距离。因此,对于每个质心,您只需找到最接近该质心的数据点,并返回相应的数据点。如果您需要,我可以提供简短的代码。
另外,只是一个提示。您可能应该使用 kmeans++ 方法来初始化质心。它更快而且通常更好。您可以使用以下方式调用它:
[idx,C,sumd,D] = kmeans(A, k, 'Distance', 'cosine', 'Start', 'plus');
以下是第 3 部分所需的代码:
[~, min_idxs] = min(D, [], 1);
closest_vecs = A(min_idxs, :);
closest_vecs
的每一行 i
都是最接近质心 i
的向量。
关于matlab - 如何理解Matlab内置函数 "kmeans"?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31844108/
我试图在 (C) Python 源代码中找到内置 in 运算符的实现。我在内置函数源代码中搜索过,bltinmodule.c ,但找不到此运算符的实现。我在哪里可以找到这个实现? 我的目标是通过扩展此
我们正在开发一个 shell(学校项目)。我们不理解一种行为。为什么内置函数在重定向时不起作用? 喜欢 cd - | command 不改变目录。 或 export NAME=VALUE | comm
有人问有关如何对列表进行排序的问题。从基本List.Sort()到List.OrderBy()有几种方法。最可笑的是自己动手的SelectionSort。我迅速将其否决,但这使我思考。应用于列表的
我正在尝试使用 C 中内置的 qsort 函数对结构进行排序 typedef struct abc{ long long int fir; long long int sec; }abc; 在
我觉得有一些内置的东西。如果对象为空,我想要默认值(或者特别是 0,我只使用十进制/整数)。是否有编写此函数的内置方法? static int GetDecimalFromObject(object
Java 是否有用于生成和解析文档的内置 XML 库?如果不是,我应该使用哪个第三方? 最佳答案 Sun Java 运行时附带 Xerces 和 Xalan 实现,它们提供解析 XML(通过 DOM
我对 python 的“all”和生成器有以下问题: G = (a for a in [0,1]) all(list(G)) # returns False - as I expected 但是:
我有一些使用 gcc 内部函数的代码。我想包含代码以防缺少内在函数。我该怎么做? #ifdef __builtin_ctzll 不起作用。 最佳答案 使用最新版本的 clang,现在可以使用 __ha
人们常说应该在本地重新声明(某些)Lua 函数,因为这样可以减少开销。但这背后的确切规则/原则是什么?我怎么知道哪些功能应该完成,哪些是多余的?还是应该为每个功能完成,甚至是您自己的功能? 不幸的是,
我想实现以下功能: TestClass values 接受任意数量的 NewClass 对象 只有 NewClass 对象没有完全相同的属性值被添加到TestClass.values 我想出了这个:
我正在尝试编写一个存储过程(使用 SQL Server Management Studio 2008 R2)以从表中检索最大测量值。这似乎是一件容易的事,所以我写了一个简短的存储过程来获取 MAX。但
我刚写了我的第一个Electron应用程序。现在,我正在尝试通过electron-packager构建它。我的package.json看起来像这样: { "name": "pixelcast",
我正在寻找在 WPF 应用程序中使用的“安全”字体系列列表 - 应该安装在所有能够运行 WPF 的客户端机器上的字体系列。 Silverlight 有一个明确定义的列表( listed on MSDN
好吧,(在写了几次之后)发现System.Windows.Controls命名空间中已经有一个BooleanToVisibilityConverter,这真是一个惊喜。 可能还有更多这样隐藏的节省时间
在我的 gradle 构建文件中,我有以下插件 block plugins { `java-library` jacoco checkstyle } 这些都没有指定版本,但一切
关闭。这个问题需要多问focused 。目前不接受答案。 想要改进此问题吗?更新问题,使其仅关注一个问题 editing this post . 已关闭 3 年前。 Improve this ques
10 implementations String#reverse 已根据每个浏览器进行分析。 自 2011 年以来已对这些实现进行了解释。 当 ES6 出现时,有很多代码变得更加优雅和性能。 关于
在 Julia 包 BenchmarkTools 中,有一些像 @btime、@belapse 这样的宏对我来说似乎是多余的,因为 Julia 内置了@time、@elapse 宏。在我看来,这些宏服
我正在尝试编写一个简单的 LLVM 通行证,其目标如下: 查找所有 call指示。 在被调用函数中插入我编写的外部函数。 例如,考虑我有以下示例程序: #include #include int
我理解 'a) -> (rhs:'a -> 'a) -> 'a 在我感兴趣的情况下,我经常发现自己想要类似 (lhs:'a -> 'b) -> (rhs:'c -> 'b) -> 'b 的东西在侧面
我是一名优秀的程序员,十分优秀!