python - XGBoost 回归 - 预测值超出训练范围-6ren

python - XGBoost 回归 - 预测值超出训练范围

转载作者：行者123 更新时间：2023-12-04 03:38:34

32

4

包含各种特征和回归目标(称为 qval)的数据集用于训练 XGBoost 回归器。该值 qval 介于 0 和 1 之间，应具有以下分布:

到目前为止，还不错。但是，当我使用 xgb.save_model() 保存模型并使用 xgb.load_model() 重新加载它以在另一个数据集上预测此 qval 时，预测的 qval 超出 [0,1] 边界，如此处所示。

有人可以解释这是否正常，如果是，为什么会这样？从我的角度来看，可能只是计算 qval 的“方程式”(这里是非常糟糕的词)是在某些数据上训练的，而权重并没有真正考虑到 [0,1] 边界。因此，当将这些“权重”应用于新数据时，结果超出范围。虽然不完全确定。

最佳答案

是的，xgboost 可以在训练标签范围之外进行预测。

from sklearn.datasets import make_classification
from sklearn.ensemble import GradientBoostingRegressor

X, y = make_classification(random_state=42)

gbm = GradientBoostingRegressor(max_depth=1,
                                n_estimators=10,
                                learning_rate=1,
                                random_state=42)
gbm.fit(X,y)
preds = gbm.predict(X)
print(preds.min(), preds.max())
# Output
#-0.010418732339562916 1.134566081403055

这可能意味着您的测试集与训练集不同。

对于随机森林和决策树，这不会发生。

这种现象与增强集成及其工作原理有关。

关于python - XGBoost 回归 - 预测值超出训练范围，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/66475093/

32

4

0

文章推荐： maven - PMD 排除不起作用

文章推荐： wpf - TabItem : Show on header, 上的工具提示，但不在内容上

超出 API 配额
在文档中我们可以找到 The limits are based on a moving window that tracks the number of requests you send per h
超出 Azure 配额
我试图了解使用 Windows Azure 托管 Web 服务的正确方法。在阅读了一些可用的文档后，我已经达到以下几行: Windows Azure takes the following actio
超出 LDAPException 大小限制
我正在使用 unboundid ldap sdk 来执行 ldap 查询。运行 ldap 搜索查询时遇到一个奇怪的问题。当我对包含 50k 个条目的组运行查询时出现异常。我的异常(exception)
超出 Docker 内存限制
我有以下 docker-compose 文件: version: "2.4" services: auto_check: image: python mem_limit: 97M
超出 MongoDB 副本心跳请求时间
我有副本集(托管在亚马逊上)，其中有: 主要中学仲裁者它们都是 3.2.6 版本，这个副本正在我的分片集群中创建一个分片(如果这很重要，尽管我认为它不重要)。当我在 primary 上键入 r
c++ - 超出 C++ 的界限和未定义的行为
我知道在 C++ 中访问缓冲区边界是未定义的行为。这是来自 cppreference 的示例: int table[4] = {}; bool exists_in_table(int v) {
jquery - 超出 div 时禁用鼠标点击
嗨，我有一个表单的 div。我希望当鼠标离开 div 时禁用单击事件。所以我尝试了这个，但它不起作用，div 仍然可以点击。有什么想法吗？？ var flag = false; $("#foo").l
.net - 超出 HttpClient 缓冲区大小限制
我正在使用我的客户端获取有关存储在我的 Swift 对象存储中的某个文件的一些信息，该文件可以通过 REST Api 访问。在 Swift 中，指向指定对象的 HEAD 方法和 url 返回它的元数据
excel - 超出 Excel 中的最大字符限制
如何在 Excel 的 CONCATENATE 函数中使用超过 255 个字符？我实际上也在 EXCEL 的 HYPERLINK 函数中使用 CONCATENATE 函数。一个例子如下: =HYPER
java - 超出 BufferedReader 的大小限制？
在 java 6 web 应用程序中，我尝试从执行的命令中检索大量输出。我在 javaworld article 上“借用/窃取/基于”它。我面临的问题是，由于输出被截断，长度似乎超出了大小限制。我已
JQuery:超出 RangeError 最大调用堆栈
我有一个更改事件，当选择框更改时会触发该事件。然而，选择框位于被替换的 div 内，因此会重新生成选择框。由于此错误可能是由于无限循环造成的，因此我猜测创建选择框时也必须触发我的触发事件。我尝试了很多
c# - 超出 JavaScriptSerializer maxJsonLength
我正在 visual studio 2013 中用 c# 创建一个网络服务。我已连接到数据库并使用以下代码返回 json。 [WebMethod] [ScriptMethod(ResponseForm
php - 超出 IP 连接限制
我使用 php 脚本解析远程 xml 文件并将网页上的输出打印到 div 中。由于我需要输出必须与当前播放的轨道同步，所以我使用 Javascript 每 20 秒重新加载一次 div 内容。在测试页
c - 超出 read() 的缓冲区大小
#define MAX_BUFF_SIZE 64 char input[MAX_BUFF_SIZE]; int inSize = read(0, input, MAX_BUFF_SIZE); if
c# - 超出 WCF MaxConcurrentSessions
我在申请公司时遇到了问题。我将总结系统的关键要素: 我公司的系统几年前就在 Windows XP 和 7(家庭版、专业版、基本版)机器上运行。它是用 .NET 4.0 编写的，基于 WCF。它使
c++ - 超出 DirectX11 视频内存
我有一个渲染循环，用于监听数位板输入并从顶点/索引缓冲区(以及其他内容)中绘制。顶点数据可以增长，当它达到一定水平时，DispatchMsg(&msg) 会遇到这种情况: Unhandled exce
超出 Java Postgres 连接限制
我通过 Postgres JDBC 驱动程序使用 Java 1.7 和 Postgres。将从 Web 服务使用数据库连接。在测试中，我得到了以下错误: FATAL: connection limit
android - 超出 Firebase 实时数据库限制
我想知道当超过 Firebase 实时数据库的限制时会发生什么。问题是我知道我可以拥有的最大连接数仅为 100。现在，假设我的 Android 应用程序有 1,000 个活跃用户，并且我实现了实时数据
Node.js maxFieldSize 超出
我正在将一组图像上传到我的 node.js Express 服务器，但收到错误 - “错误:超出 maxFieldsSize”。看起来默认的 maxFieldsSize 是 2MB。我需要能够上传最多
python - 超出 Django 最大递归深度
我正在使用 Django 构建一个小型 Web 项目，该项目有一个包含 ImageField 的模型 (Image)。当我尝试使用管理界面上传图片时，我遇到了这个问题(删除了个人身份信息): Runt

首页

博学

6Ren·AI

商城

python - XGBoost 回归 - 预测值超出训练范围