- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
这是代码。
from sklearn.neighbors import NearestNeighbors
import numpy as np
X = np.array([[-1, -1], [-2, -1], [-3, -2], [1, 1], [2, 1], [3, 2]])
nbrs = NearestNeighbors(n_neighbors=2, algorithm='ball_tree').fit(X)
distances, indices = nbrs.kneighbors(X)
>indices
>array([[0, 1],[1, 0],[2, 1],[3, 4],[4, 3],[5, 4]])
>distances
>array([[0. , 1. ],[0. , 1. ],[0. , 1.41421356], [0. , 1. ],[0. , 1. ],[0. , 1.41421356]])
我不太明白“索引”和“距离”的形状。我如何理解这些数字的含义?
最佳答案
实际上非常简单。对于 kneighbors()
(此处为 X
)输入中的每个数据样本,它将显示 2 个邻居。 (因为您已指定n_neighbors=2
。indices
将为您提供训练数据的索引(此处再次为X
)和距离
将为您提供训练数据中相应数据点的距离(索引所指的)。
以单个数据点为例。假设 X[0]
作为第一个查询点,答案将是 indices[0]
和 distances[0]
所以对于X[0]
,
训练数据中第一个最近邻的索引为 indices[0, 0] = 0
,距离为 distances[0, 0] = 0
。您可以使用该索引值从训练数据中获取实际的数据样本。
这是有道理的,因为您使用相同的数据进行训练和测试,因此每个点的第一个最近邻是其本身,距离为 0
。
第二个最近邻居的索引为 indices[0, 1] = 1
,距离为 distances[0, 1] = 1
对于所有其他点也类似。 indices
和 distances
中的第一个维度对应于查询点,第二个维度对应于所询问的邻居数量。
关于python - 与 sklearn.neighbors.NearestNeighbors 的输出混淆,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53886289/
我正在使用 sklean.neighbors 库中的 NearestNeighbors() 来传递 117*12 矩阵。我正在查看索引二维数组。第一个元素 indices[i][0] 应该是节点本身。
我正在比较两个不同大小的点云。我不想切断较大的点云 pc1 中的最后一点。对于 pc1 中的点,我想在 pc2 中找到最近的邻居。在 pc1 和 pc2 中使用该点后,它应该不再次用于任何其他比较。计
这是代码。 from sklearn.neighbors import NearestNeighbors import numpy as np X = np.array([[-1, -1], [-2,
我在我的语料库中使用 python 和 gensim 计算了一个 word2vec 模型。 然后我计算了每个句子的平均 word2vec 向量(平均句子中所有单词的所有向量)并将其存储在 pandas
尝试开始使用 Python 的 SciKitLearn 库,但对 NearestNeighbors 分类器和 KNeighbors 分类器之间的区别感到困惑。看起来论点相似但又不完全相同......
我正在使用 scikit-learn NearestNeighbors 寻找最近的邻居,在 people wiki 数据上使用 tfidf。 在我的 .kneighbors() 方法调用中 res =
我是一名优秀的程序员,十分优秀!