machine-learning - 如何使用高斯过程进行二元分类？-6ren

machine-learning - 如何使用高斯过程进行二元分类？

转载作者：行者123 更新时间：2023-11-30 08:41:37

24

4

我知道高斯过程模型最适合回归而不是分类。但是，我仍然想将高斯过程应用于分类任务，但我不确定对模型生成的预测进行分类的最佳方法是什么。我已经查看了 scikit-learn 网站上提供的高斯过程分类示例:

http://scikit-learn.org/stable/auto_examples/gaussian_process/plot_gp_probabilistic_classification_after_regression.html

但是我发现这个例子令人困惑(我在问题末尾列出了我发现这个例子令人困惑的事情)。为了尝试更好地理解，我使用 scikit-learn 创建了一个非常基本的 Python 代码示例，该示例通过将决策边界应用于高斯过程所做的预测来生成分类:

#A minimum example illustrating how to use a
#Gaussian Processes for binary classification
import numpy as np
from sklearn import metrics
from sklearn.metrics import confusion_matrix
from sklearn.gaussian_process import GaussianProcess

if __name__ == "__main__":
    #defines some basic training and test data
    #If the descriptive features have large values
    #(i.e., 8s and 9s) the target is 1
    #If the descriptive features have small values
    #(i.e., 2s and 3s) the target is 0
    TRAININPUTS = np.array([[8, 9, 9, 9, 9],
                            [9, 8, 9, 9, 9],
                            [9, 9, 8, 9, 9],
                            [9, 9, 9, 8, 9],
                            [9, 9, 9, 9, 8],
                            [2, 3, 3, 3, 3],
                            [3, 2, 3, 3, 3],
                            [3, 3, 2, 3, 3],
                            [3, 3, 3, 2, 3],
                            [3, 3, 3, 3, 2]])
    TRAINTARGETS = np.array([1, 1, 1, 1, 1, 0, 0, 0, 0, 0])
    TESTINPUTS = np.array([[8, 8, 9, 9, 9],
                           [9, 9, 8, 8, 9],
                           [3, 3, 3, 3, 3],
                           [3, 2, 3, 2, 3],
                           [3, 2, 2, 3, 2],
                           [2, 2, 2, 2, 2]])
    TESTTARGETS = np.array([1, 1, 0, 0, 0, 0])
    DECISIONBOUNDARY = 0.5

    #Fit a gaussian process model to the data
    gp = GaussianProcess(theta0=10e-1, random_start=100)
    gp.fit(TRAININPUTS, TRAINTARGETS)
    #Generate a set of predictions for the test data
    y_pred = gp.predict(TESTINPUTS)
    print "Predicted Values:"
    print y_pred
    print "----------------"
    #Convert the continuous predictions into the classes
    #by splitting on a decision boundary of 0.5
    predictions = []
    for y in y_pred:
        if y > DECISIONBOUNDARY:
            predictions.append(1)
        else:
            predictions.append(0)
    print "Binned Predictions (decision boundary = 0.5):"
    print predictions
    print "----------------"
    #print out the confusion matrix specifiy 1 as the positive class
    cm = confusion_matrix(TESTTARGETS, predictions, [1, 0])
    print "Confusion Matrix (1 as positive class):"
    print cm
    print "----------------"
    print "Classification Report:"
    print metrics.classification_report(TESTTARGETS, predictions)

当我运行此代码时，我得到以下输出:

Predicted Values:
[ 0.96914832  0.96914832 -0.03172673  0.03085167  0.06066993  0.11677634]
----------------
Binned Predictions (decision boundary = 0.5):
[1, 1, 0, 0, 0, 0]
----------------
Confusion Matrix (1 as positive class):
[[2 0]
 [0 4]]
----------------
Classification Report:
         precision    recall  f1-score   support

          0       1.00      1.00      1.00         4
          1       1.00      1.00      1.00         2

avg / total       1.00      1.00      1.00         6

这个基本示例中使用的方法似乎适用于这个简单的数据集。但这种方法与我上面提到的 scikit-lean 网站上给出的分类示例有很大不同(此处重复 URL):

http://scikit-learn.org/stable/auto_examples/gaussian_process/plot_gp_probabilistic_classification_after_regression.html

所以我想知道我是否在这里遗漏了一些东西。因此，如果有人能够:

关于 scikit-learn 网站上给出的分类示例:
1.1 解释一下这个例子中生成的概率是什么概率？它们是查询实例属于该类的概率 >0 吗？
1.2 为什么示例使用累积密度函数而不是概率密度函数？
1.3 为什么示例将模型做出的预测除以均方误差的平方根，然后再输入累积密度函数？
关于我在这里列出的基本代码示例，请澄清将简单的决策边界应用于高斯过程模型生成的预测是否是进行二元分类的适当方法？

很抱歉问了这么长的问题，感谢您的帮助。

最佳答案

在 GP 分类器中，函数上的标准 GP 分布被“压缩”，通常使用标准正态 CDF(也称为 probit function )，将其映射到二元类别上的分布。

此过程的另一种解释是通过分层模型(此 paper 有推导)，并带有从高斯过程中提取的隐藏变量。

在 sklearn 的 gp 库中，y_pred, MSE=gp.predict(xx, eval_MSE=True) 的输出看起来是(近似)后验均值 (y_pred) >) 和后验方差 (MSE) 在 发生任何挤压之前中的 xx 点进行评估。

要获得测试集中的点属于正类的概率，您可以通过应用正态 CDF 将 y_pred 上的正态分布转换为二元分布(请再次参阅[本文]了解详情)。

概率压缩函数的分层模型由 0 决策边界定义(标准正态分布围绕 0 对称，即 PHI(0) =.5)。因此您应该设置 DECISIONBOUNDARY=0。

关于machine-learning - 如何使用高斯过程进行二元分类？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/21031273/

24

4

0

文章推荐： javascript - Angular 两次渲染主视图而不是加载正确的模板

文章推荐： java - 使用 POST 调用使用 REST Web 服务返回 415

文章推荐： java - 确定一个词是否是 Apache Derby 中的保留字

virtual-machine - "process virtual machine"与 "system virtual machine"的区别
进程虚拟机和系统虚拟机有什么区别？我的猜测是，进程 VM 没有为该操作系统的整个应用程序提供一种操作系统，而是为某些特定应用程序提供环境。系统虚拟机为操作系统提供了一个安装环境，就像 Virtua
C# :Does Client machine need SQL Server installed on it while connecting to other machine having SQL Server installed on it (the Server machine)
我写了一个 C# windows 应用程序表单，它在客户端机器上运行并连接到另一台机器上的 SQL 服务器。在 C# 中建立连接时，我使用了像这样的 dll 1)microsoft.sqlserver
machine-learning - 线性回归标准化的影响: Machine Learning
作为我作业的一部分，我正在处理几个数据集，并通过线性回归查找它们的训练错误。我想知道标准化是否对训练误差有影响？对于标准化前后的数据集，我的相关性和 RMSE 是相等的。谢谢最佳答案很容易证明，
docker-machine - 无法使用 docker-machine 添加主机
我在公司数据中心的 linux VM 上安装了 docker-engine。我在 Windows 上安装了 docker-machine。我想通过我的 Windows 机器管理这个 docker-en
SAS 服务器 : How to get machine name of client machine?
我在我的 PC 上运行 SAS Enterprise Guide 以连接到位于我们网络内的服务器上的 SAS 实例。我正在编写一个将在服务器上运行的 SAS 程序，该程序将使用 ODS 将 HTML
machine.config - ASP.Net Machine.Config 转换
我正在创建一个包含 ASP.Net HttpModule 和 HttpHandler 的强签名类库。我已经为我的库创建了一个 visual studio 安装项目，该项目在 GAC 中安装了该库，但
docker-machine - 如何将现有的 Docker 服务器导入到 Docker Machine？
我试过 docker-machine create -d none --url tcp://:2376 remote并复制 {ca,key,cert}.pem (客户端证书)到机器目录。然后我做了 e
LLVM 代码生成器 : is Machine code representation machine-agnostic?
请注意 : 这个问题不是关于 LLVM IR , 但 LLVM 的 MIR ，一种低于前一种的内部中间表示。本文档关于 LLVM Machine code description classes ，
turing-machines - 有没有解决 "Construct a Turing machine ..."问题的简单方法？
我理解图灵机的逻辑。当给出图灵机时，我可以理解它是如何工作的以及它是如何停止的。但是当它被要求构造图灵机，难度更大。有什么简单的方法可以找到问题的答案，例如: Construct a Turing
math - "finite state machine"和 "state machine"之间有区别吗？
我不确定我是否理解有限状态机和状态机之间是否有区别？我是不是想得太难了？最佳答案 I'm not sure I understand if there is a difference between
docker-machine - 无法成功创建 docker 机器 : Error creating machine
我遵循 docker 入门教程并到达第 4 部分，您需要使用 virtualbox ( https://docs.docker.com/get-started/part4/#create-a-clus
virtual-machine - 如何在 Virtual Machine Manager 中启用 QEMU-Monitor 控制台？
我使用 Virtual Machine Manager 通过 QEMU-KVM 运行多个客户操作系统。我在某处读到，通过输入 ctrl+alt+2 应该会弹出监视器控制台。它不工作或禁用。有什么办法可
c - LNK1112 : module machine type 'IA64' conflicts with target machine type 'X86'
当我尝试在项目中包含 libc.lib 时，会出现此错误，即使我的 Windows 是 32 位，也会出现此错误。不知道我是否必须从某个地方下载它或什么。最佳答案您正在尝试链接为 IA64 架构编
machine-learning - 短语 "a machine learning algorithm learn a probability distribution"是什么意思？这里究竟发生了什么
生成模型和判别模型似乎可以学习条件 P(x|y) 和联合 P(x,y) 概率分布。但从根本上讲，我无法说服自己“学习概率分布”意味着什么。最佳答案这意味着您的模型要么充当训练样本的分布估计器，要么
opencv - 'LNK1112 : module machine type 'x64' conflicts with target machine type 'X86'
我正在使用 visual studio 2012.我得到了错误 LNK1112: module machine type 'x64' conflicts with target machine typ
macos - 如何修复 "error in run: Failed to get machine "boot2docker-vm": machine does not exist"?
使用 start|info|stop|delete 参数运行 boot2docker导致错误消息: snowch$ boot2docker start error in run: Failed to
azure - Vagrant-Azure : Guest machine can't connect to host machine (Unable to copy SMB files)
到目前为止，我一直只在本地使用 Vagrant，现在我想使用 Azure 作为提供程序来创建 VM，但不幸的是，我遇到了错误，可以在通过链接访问的图像上看到该错误。我明白它说的是什么，但我完全不知道如
c++ - 错误 LNK1112 : module machine type 'x64' conflicts with target machine type 'X86'
这个问题在这里已经有了答案: 关闭 10 年前。 Possible Duplicate: linking problem: fatal error LNK1112: module machine t
Node.js DGRAM 模块 : Cannot send UDP message to remote machine but can to local machine
我正在使用 Nodejs 的 dgram 模块运行一个简单的 UDP 服务器。相关代码很简单: server = dgram.createSocket('udp4'); serve
wix - 错误 LGHT0204 : ICE57: Component has both per-user and per-machine data with a per-machine KeyPath
嗨，我收到以下错误，导致构建失败，但在 bin 中创建了 Wix 安装程序 MSI。我怎样才能避免这些错误或抑制？错误 LGHT0204:ICE57:组件 'cmp52CD5A4CB5D668097

首页

博学

6Ren·AI

商城

machine-learning - 如何使用高斯过程进行二元分类？