gpt4 book ai didi

machine-learning - 一个特征在不同的范围内有不同的含义

转载 作者:行者123 更新时间:2023-11-30 09:09:36 27 4
gpt4 key购买 nike

在机器学习中,如何处理像工资这样的特征。例如,如果我通过基于特征测量数据点之间的距离来应用 k 最近邻。假设我们有两个点,工资分别为 2000 和 6000。它们之间的差异是 4000。让我们查看另外两个点,工资分别为 102000 和 106000。这里的差异仍然是 4000$,但我们人类认为最后两个点比前两点。

如何将这种直觉融入机器学习中?

最佳答案

您可以执行以下操作之一(以及更多操作):

  • 使用 log 函数转换特征(因此 2000 和 6000 将比 102000 和 106000 远得多)
  • 将特征二值化到多个存储桶中(您将为每个薪资范围创建一个特征,并且您是创建存储桶的人)
  • 更改 k-nn 中的相似度函数以查看相对差异而不是绝对差异

关于machine-learning - 一个特征在不同的范围内有不同的含义,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43160649/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com