gpt4 book ai didi

algorithm - 邻居数KNN算法

转载 作者:塔克拉玛干 更新时间:2023-11-03 04:02:35 26 4
gpt4 key购买 nike

我在matlab中应用KNN算法对手写数字进行分类。数字最初是 8*8 的矢量格式,然后拉伸(stretch)形成一个 1*64 的矢量。所以每次我将第一个数字与所有其余数据集(相当大)进行比较,然后将第二个数字与其余数据集等进行比较等等。现在我的问题是,一个邻居不是最好的选择总是?由于我使用的是欧几里得距离,(我选择更近的那个)为什么我还要选择 2 或 3 个邻居,因为我得到了最接近的数字?

谢谢

最佳答案

您必须考虑噪音。假设您的一些分类示例可能被错误分类,或者其中一个与其他示例非常接近——它们不同,但实际上只是一个“故障”。在这些情况下 - 根据这个偏离轨道的示例进行分类可能会导致错误。

根据个人经验,通常当 k=3/5/7 时可获得最佳结果,但这取决于实例。

如果你想获得最佳性能 - 你应该使用 cross validation top 为您的特定实例选择了最佳的 k

此外,通常仅使用奇数作为 KNN 的k,以避免“平局”

关于algorithm - 邻居数KNN算法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10174755/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com