gpt4 book ai didi

r - R 中 KKNN 包中的最近邻在使用整个数据集时给出垃圾索引值

转载 作者:行者123 更新时间:2023-11-30 08:36:38 28 4
gpt4 key购买 nike

我正在 R 中使用“kknn”包来查找数据集中每一行的所有最近邻居。由于一些奇怪的原因,测试数据集中的最后一行总是被忽略。下面是 R 代码和获得的输出。

X1 <- c(0.6439659, 0.1923593, 0.3905551, 0.7728847, 0.7602632)
X2 <- c(0.9147394, 0.6181713, 0.8515923, 0.8459367, 0.9296278)
Class <- c(1, 1, 0, 0, 0)
Data <- data.frame(X1,X2,Class)
Data$Class <- as.factor(Data$Class)
library("kknn")
### Here, both training and testing data sets is the object Data
Neighbors.KNN <- kknn(Data$Class~., Data,Data,k = 5, distance =2, kernel = "gaussian")

## Output
## The Column 5 in the below output is filled with garbage values and the value of the first value in the last row is 4, when it has to be 5.
Neighbors.KNN$C
[,1] [,2] [,3] [,4] [,5]
[1,] 1 4 3 2 3245945
[2,] 2 3 4 1 3245945
[3,] 3 1 4 2 3245945
[4,] 4 1 3 2 3245945
[5,] 1 4 3 2 3245945

如果我做错了什么或者这是包中的错误,有人可以告诉我吗?

最佳答案

当前的实现(默默地)假设 k 小于 n(行数)。一般来说,k << n 这种情况没有问题。第 (k+1) 个用于缩放距离。我应该在文档中提到这一点。

问候,克劳斯

关于r - R 中 KKNN 包中的最近邻在使用整个数据集时给出垃圾索引值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29724801/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com