python - 如何使用 Isolation Forest 和结果分数正确识别异常？-6ren

python - 如何使用 Isolation Forest 和结果分数正确识别异常？

转载作者：行者123 更新时间：2023-12-02 19:50:35

26

4

我正在尝试使用 sklearn 中的隔离森林算法检测数据框中的异常值。

这是我用来设置算法的代码:

iForest = IsolationForest(n_estimators=100, max_samples=256, contamination='auto', random_state=1, behaviour='new')
iForest.fit(dataset)
scores = iForest.decision_function(dataset)

现在，由于我不知道污染的良好值(value)是多少，我想检查我的分数并根据分数的分布决定在哪里画线。这是图表和图表本身的代码:

plt.figure(figsize=(12, 8))
plt.hist(scores, bins=50);

假设负分表示数据框中的异常值是否正确？我找不到关于 IF 分数的范围以及这些分数如何工作的很好的解释(为什么我得到负分？)。

此外，有没有办法将这些分数附加到原始数据集，并手动检查具有负分数的行以查看它们是否有意义？

谢谢!

最佳答案

解决此问题的一种方法是使用 score_samples sklearn 的 isolationforest 模块中可用的方法。将模型拟合到数据后，使用 score_samples 方法找出每个样本的异常分数(值越低越异常)。由于您没有关于数据中真正异常的信息，您可以根据您获得的分数对样本进行排序，并手动查看记录以查看分数最低的样本是否实际上是异常，在此在这个过程中，您可以想出一个阈值来将数据点分类为异常，稍后您可以将其用于任何新数据以检查它们是否异常。

关于python - 如何使用 Isolation Forest 和结果分数正确识别异常？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/58215284/

26

4

0

文章推荐： xcode4.2 - 为什么我不能从 Storyboard中删除一些控件 - Xcode

文章推荐： workflow - 高吞吐量和 Windows Workflow Foundation

文章推荐： css - 如何使用Live Sass Compiler编译相关的scss文件？

java - Spring框架，@Transactional(isolation = Isolation.DEFAULT)
来自文档: Isolation.DEFAULT Use the default isolation level of the underlying datastore. 对于其他隔离级别，我们可以在
java - @Transactional(isolation = Isolation.SERIALIZABLE) 重试机制
@Transactional(isolation = Isolation.SERIALIZABLE) 我在我的 spring 项目中的几个方法上有这个注释。如果由于“序列化访问问题”而出现异常，如果我
javascript - "Isolate"在V8中的作用是什么？怎么可能单独制作 "Isolate"呢？
到目前为止我发现的“隔离”的解释。实验#1:http://izs.me/v8-docs/classv8_1_1Isolate.html “Isolate 表示 V8 引擎的一个孤立实例。V8 分离株
c# - TypeMock Isolator 与 Isolator Basic 完全兼容
我是单元测试和 Typemock 的新手。我想选择 typemock，因为我有很多遗留代码和很多依赖项。我知道 Isolator Basic 是免费版本，但他们也提供了 Isolator Comple
javascript - AngularJS: "isolate scope"还是 "isolated scope"？
定义指令时，通常为它们提供一个独立的作用域，并且原型(prototype)上不会从任何父作用域继承。我一直很困惑这个术语应该是“隔离范围”还是“隔离范围”。似乎大多数 AngularJS 官方文档都
python - pip install --no-build-isolation 返回没有这样的选项 : --no-build-isolation
$ pip install --no-build-isolation --editable . Usage: pip install [options] [package-index-opt
isolation-level - 我应该使用哪个隔离级别来预订航类
我有一个使用 mssql 的航类预订程序 ,对于预订航类，我想确定我应该使用隔离级别还是锁？ (这是一个示例代码，我的问题是这种情况的隔离级别不做保留) 我的数据库有一个库存表，如: Inventor
Dart Isolates 的暂停功能未按预期工作
我一直在玩 Dart Isolates并且在使用 isolate.pause(); 时遇到了问题功能。 import 'dart:io'; import 'dart:isolate'; main(){
flutter - Isolate 的入口点函数不能标记为异步
隔离示例 flutter !不起作用。新的隔离不会运行。但是如果我删除入口点函数的 async。它工作正常。那么，如何在 flutter 中的新隔离中进行等待操作。最佳答案可能存在 Dart 2
当应用程序被杀死时，Flutter isolate 不显示通知
当应用程序被杀死时，使用 flutter isolate 包的 Flutter isolates 不会显示通知。尝试将 isolate 包与 dart:isolate 一起使用，但不起作用。 imp
Dart Isolate vs Akka
据我了解，Dart 隔离就像 Akka Actor 。然而，我想不通的是，如果 dart:isolate用途与 Akka 类似做。两者之间有根本区别吗？是 dart:isolate一个 Actor
.net - "Typemock Isolator"如何模拟静态方法？
正如你们中的一些人所知道的，在 .net 中模拟静态方法通常是不可能的。通过模拟，我的意思是用另一个具有相同签名的方法替换类中的方法，通常用于测试目的。用于模拟方法的两种主要方法是将其声明为虚拟方
dart - 使用 isolate 提高应用程序性能
我有一个生成散列密码的应用程序，生成它需要时间。我认为为了提高性能，我会让散列密码生成器在一个单独的核心中工作。我的计算机支持 3 个核心处理器，我认为使用 dart:isolate 来计算其他处理器
dart - 我应该如何使用Dart Isolate unhandledExceptionCallback？
我正在尝试在Dart Web应用程序中使用隔离，但是我似乎无法使错误回调参数起作用。我有一个非常基本的代码正在Dartium中运行。 import "dart:isolate"; void main
multithreading - 如何处理 Isolates 中抛出的异常？
我正在试验 Dart 并使用新的 streamSpawnFunction 创建一个新的隔离。我在 Dartium 中运行我的代码，但我注意到如果在隔离中发生某种不可恢复的错误，我不会在控制台上收到任
flutter - 如何在 Isolate 上实例化本地通知？
我的问题的背景:我正在开发一个 Flutter 应用程序，它每隔几个小时执行一次重复的后台事件，并在有任何更新时通知用户。目前，我已经创建了一个能够执行后台事件的隔离功能(但目前尚未安排)，并且我正
c++ - 我可以创建多少个 v8 isolate？
我需要在 V8 中有数千个隔离物。但是当我有一些空闲 RAM 时，我遇到了奇怪的内存问题，但是 v8 抛出了 OOM 错误消息。例如，在这种特殊情况下，您可以看到当 V8 抛出此错误时我们仍然有一
flutter - 使用 Isolate 处理大量任务
我有大约 10k 个长时间运行的任务需要按顺序计算。为此，我决定使用 Isolates。问题是我应该每次都为每个单独的任务创建 spawn Isolate 还是应该为所有任务的执行只创建一个 Isol
c# - Moles Isolation 框架是如何实现的？
Moles是微软创建的隔离框架。 Moles 的一个很酷的特性是它可以“模拟”静态/非虚拟方法和密封类(这对于像 Moq 这样的框架是不可能的)。下面是 Moles 可以做什么的快速演示: Asser
java - 垃圾回收"Island of isolation"
谁能解释一下垃圾收集的孤立岛的概念吗？最佳答案对象 A 引用对象 B。对象 B 引用对象 A。对象 A 和对象 B 都没有被任何其他对象引用。那是一座孤岛。基本上，隔离岛是一组相互引用但不被应用

首页

博学

6Ren·AI

商城

python - 如何使用 Isolation Forest 和结果分数正确识别异常？