gpt4 book ai didi

algorithm - k-Nearest-Neighbor算法中如何同时使用二进制和连续特征?

转载 作者:塔克拉玛干 更新时间:2023-11-03 02:29:52 26 4
gpt4 key购买 nike

我的特征向量具有连续(或范围广泛)和二元分量。如果我简单地使用欧几里德距离,连续分量将产生更大的影响:

将对称与不对称表示为 0 和 1 以及从 0 到 100 的一些不太重要的比率,与将比率更改为 25 相比,从对称更改为不对称具有微小的距离影响。

我可以为对称性增加更多权重(例如,将其设为 0 或 100),但有更好的方法吗?

最佳答案

您可以尝试使用归一化欧几里得距离,例如,在第一部分末尾描述的 here .

它只是按标准差对每个特征(连续或离散)进行缩放。这比另一位发帖人建议的按范围 (max-min) 缩放更稳健。

关于algorithm - k-Nearest-Neighbor算法中如何同时使用二进制和连续特征?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4314869/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com