gpt4 book ai didi

r - R 中的圆柱聚类 - 与其他数据的聚类时间戳

转载 作者:行者123 更新时间:2023-12-04 12:36:59 24 4
gpt4 key购买 nike

我正在学习 R,我必须使用时间戳字段对数字数据进行聚类。其中一个参数是时间,由于数据严格依赖昼夜,我想考虑该数据的“球形”性质。

据我从手册中看到的,诸如 skmeans 之类的库无法处理“圆柱形”数据,只能处理“球形”数据(即所有分量都在极坐标中)。

我对合适解决方案的想法如下:我可以将 HOUR 列 (0-24) 分解为两个不同的列 X,Y 并用极坐标表示时间,例如 x^2+y^2=1 .这样,具有欧氏距离的 k-means 在解释数据时应该没有问题。

我说得对吗?

最佳答案

这是 hm 的映射,其中 h 是以小时为单位的时间(和小时的小数部分)。然后我们尝试 kmeans,至少在这个测试中它似乎有效:

h <- c(22, 23, 0, 1, 2, 10, 11, 12)
ha <- 2*pi*h/24
m <- cbind(x = sin(ha), y = cos(ha))

kmeans(m, 2)$cluster # compute cluster assignments via kmeans
## [1] 2 2 2 2 2 1 1 1

关于r - R 中的圆柱聚类 - 与其他数据的聚类时间戳,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25213524/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com