gpt4 book ai didi

machine-learning - Isolation Forest 需要数据标准化吗?

转载 作者:行者123 更新时间:2023-12-05 02:08:27 26 4
gpt4 key购买 nike

我希望使用 Isolation Forest 对某些系统时间序列数据进行离群值检测。在我的例子中,特征的规模是多种多样的。我的直觉告诉我应该规范化数据,但我不记得原始 Iso Forest 论文中有这个要求。任何指导表示赞赏。

最佳答案

我认为为隔离林规范化数据不是一个好主意。异常检测通常不需要规范化。根据定义,异常值/异常检测是识别与大多数点不同且较少的数据点。归一化将使所有这些点都在较小的范围内,这对我们在点之间检测的“差异”不利,这是异常值检测本身的基础。

对于隔离林,特征尺度之间的变化应该无关紧要。如果这是您唯一关心的规范化问题,您始终可以将属性“max_features”设置为 1。隔离森林是一种集成决策树算法,Max_features 是为训练每棵树/基础估计器选择的最大特征数。如果您将其设置为 1(默认情况下始终为 1),每棵树将只涉及一个特征,因此规模差异无关紧要。

关于machine-learning - Isolation Forest 需要数据标准化吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/60877853/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com