- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我正在尝试绘制 ROC 曲线来评估隔离森林对乳腺癌数据集的准确性。我从混淆矩阵中计算出真阳性率 (TPR) 和假阳性率 (FPR)。但是,我不明白 TPR 和 FPR 是如何以矩阵形式出现的,而不是单个整数值。而且ROC曲线似乎只对矩阵形式的FPR和TPR有效(我也试过手动写计算FPR和TPR的代码)。
TPR 和 FPR 值总是以矩阵的形式存在吗?
无论哪种方式,我的 ROC 曲线都是一条直线。为什么会这样?
混淆矩阵:
from sklearn.metrics import confusion_matrix
cnf_matrix = confusion_matrix(y, y_pred_test1)
订单:
> [[ 5 25]
> [ 21 180]]
True Positive 和 False Positive:(另外,为什么这些值直接取自混淆矩阵?)
F_P = cnf_matrix.sum(axis=0) - np.diag(cnf_matrix)
F_N = cnf_matrix.sum(axis=1) - np.diag(cnf_matrix)
T_P = np.diag(cnf_matrix)
T_N = cnf_matrix.sum() - (FP + FN + TP)
F_P = F_P.astype(float)
F_N = F_N.astype(float)
T_P = T_P.astype(float)
T_N = T_N.astype(float)
订单:
False Positive [21. 25.]
False Negative [25. 21.]
True Positive [ 5. 180.]
True Negative [180. 5.]
TPR 和 FPR:
tp_rate = TP/(TP+FN)
fp_rate = FP/(FP+TN)
订单:
TPR : [0.16666667 0.89552239]
FPR [0.10447761 0.83333333]
ROC 曲线:
from sklearn import metrics
import matplotlib.pyplot as plt
plt.plot(fp_rate,tp_rate)
plt.show()
订单:
最佳答案
confusion_matrix()
函数只为您提供正确/错误分类的点,但不提供有关模型对数据点错误分类时的置信度的信息。
此信息用于创建 ROC 曲线(用于衡量模型根据每个数据点对特定类别的可能性对其进行排名的能力)。
相反,使用 decision_function()
或 score_samples()
函数来计算模型对每个数据点是(或不是)异常的置信度。然后,使用 roc_curve()
获得绘制曲线本身所需的点。
这是乳腺癌数据集的示例。
from sklearn.datasets import load_breast_cancer
X, y = load_breast_cancer(return_X_y=True)
from sklearn.ensemble import IsolationForest
clf = IsolationForest(behaviour='new', max_samples=100,
random_state=0, contamination='auto')
clf.fit(X)
y_pred = clf.score_samples(X)
from sklearn.metrics import roc_curve
fpr, tpr, thresholds = roc_curve(y,y_pred)
import matplotlib.pyplot as plt
plt.plot(fpr, tpr, 'k-', lw=2)
plt.xlabel('FPR')
plt.ylabel('TPR')
plt.show()
关于python - Isolation Forest 的 ROC 曲线,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55106102/
来自文档: Isolation.DEFAULT Use the default isolation level of the underlying datastore. 对于其他隔离级别,我们可以在
@Transactional(isolation = Isolation.SERIALIZABLE) 我在我的 spring 项目中的几个方法上有这个注释。如果由于“序列化访问问题”而出现异常,如果我
到目前为止我发现的“隔离”的解释。 实验#1:http://izs.me/v8-docs/classv8_1_1Isolate.html “Isolate 表示 V8 引擎的一个孤立实例。V8 分离株
我是单元测试和 Typemock 的新手。我想选择 typemock,因为我有很多遗留代码和很多依赖项。我知道 Isolator Basic 是免费版本,但他们也提供了 Isolator Comple
定义指令时,通常为它们提供一个独立的作用域,并且原型(prototype)上不会从任何父作用域继承。我一直很困惑这个术语应该是“隔离范围”还是“隔离范围”。 似乎大多数 AngularJS 官方文档都
$ pip install --no-build-isolation --editable . Usage: pip install [options] [package-index-opt
我有一个使用 mssql 的航类预订程序 ,对于预订航类,我想确定我应该使用隔离级别还是锁? (这是一个示例代码,我的问题是这种情况的隔离级别不做保留) 我的数据库有一个库存表,如: Inventor
我一直在玩 Dart Isolates并且在使用 isolate.pause(); 时遇到了问题功能。 import 'dart:io'; import 'dart:isolate'; main(){
隔离示例 flutter !不起作用。新的隔离不会运行。但是如果我删除入口点函数的 async。它工作正常。那么,如何在 flutter 中的新隔离中进行等待操作。 最佳答案 可能存在 Dart 2
当应用程序被杀死时,使用 flutter isolate 包的 Flutter isolates 不会显示通知。 尝试将 isolate 包与 dart:isolate 一起使用,但不起作用。 imp
据我了解,Dart 隔离就像 Akka Actor 。 然而,我想不通的是,如果 dart:isolate用途与 Akka 类似做。两者之间有根本区别吗? 是 dart:isolate一个 Actor
正如你们中的一些人所知道的,在 .net 中模拟静态方法通常是不可能的。 通过模拟,我的意思是用另一个具有相同签名的方法替换类中的方法,通常用于测试目的。 用于模拟方法的两种主要方法是将其声明为虚拟方
我有一个生成散列密码的应用程序,生成它需要时间。我认为为了提高性能,我会让散列密码生成器在一个单独的核心中工作。我的计算机支持 3 个核心处理器,我认为使用 dart:isolate 来计算其他处理器
我正在尝试在Dart Web应用程序中使用隔离,但是我似乎无法使错误回调参数起作用。 我有一个非常基本的代码正在Dartium中运行。 import "dart:isolate"; void main
我正在试验 Dart 并使用新的 streamSpawnFunction 创建一个新的隔离。 我在 Dartium 中运行我的代码,但我注意到如果在隔离中发生某种不可恢复的错误,我不会在控制台上收到任
我的问题的背景:我正在开发一个 Flutter 应用程序,它每隔几个小时执行一次重复的后台事件,并在有任何更新时通知用户。 目前,我已经创建了一个能够执行后台事件的隔离功能(但目前尚未安排),并且我正
我需要在 V8 中有数千个隔离物。但是当我有一些空闲 RAM 时,我遇到了奇怪的内存问题,但是 v8 抛出了 OOM 错误消息。 例如, 在这种特殊情况下,您可以看到当 V8 抛出此错误时我们仍然有一
我有大约 10k 个长时间运行的任务需要按顺序计算。为此,我决定使用 Isolates。问题是我应该每次都为每个单独的任务创建 spawn Isolate 还是应该为所有任务的执行只创建一个 Isol
Moles是微软创建的隔离框架。 Moles 的一个很酷的特性是它可以“模拟”静态/非虚拟方法和密封类(这对于像 Moq 这样的框架是不可能的)。下面是 Moles 可以做什么的快速演示: Asser
谁能解释一下垃圾收集的孤立岛的概念吗? 最佳答案 对象 A 引用对象 B。对象 B 引用对象 A。对象 A 和对象 B 都没有被任何其他对象引用。那是一座孤岛。 基本上,隔离岛是一组相互引用但不被应用
我是一名优秀的程序员,十分优秀!