python - 使用管道的 XGBRegressor-6ren

python - 使用管道的 XGBRegressor

转载作者：行者123 更新时间：2023-12-04 04:24:28

24

4

我正在使用 XGBRegressor 与管道。管道包含预处理步骤和模型 ( XGBRegressor )。

以下是完整的预处理步骤。 (我已经定义了 numeric_cols 和 cat_cols)

numerical_transfer = SimpleImputer()
cat_transfer = Pipeline(steps = [
   ('imputer', SimpleImputer(strategy = 'most_frequent')),
   ('onehot', OneHotEncoder(handle_unknown = 'ignore'))
   ])
preprocessor = ColumnTransformer(
   transformers = [
   ('num', numerical_transfer, numeric_cols),
   ('cat', cat_transfer, cat_cols)
   ])

最后的管道是
my_model = Pipeline(steps = [('preprocessor', preprocessor), ('model', model)])
当我尝试不使用时适合 early_stopping_rounds 代码工作正常。
(my_model.fit(X_train, y_train))
但是当我使用 early_stopping_rounds 如下所示，我收到错误。

my_model.fit(X_train, y_train, model__early_stopping_rounds=5, model__eval_metric = "mae", model__eval_set=[(X_valid, y_valid)])

我在以下位置遇到错误:

 model__eval_set=[(X_valid, y_valid)]) and the error is

ValueError: DataFrame.dtypes for data must be int, float or bool.
Did not expect the data types in fields MSZoning, Street, Alley, LotShape, LandContour, Utilities, LotConfig, LandSlope, Condition1, Condition2, BldgType, HouseStyle, RoofStyle, RoofMatl, MasVnrType, ExterQual, ExterCond, Foundation, BsmtQual, BsmtCond, BsmtExposure, BsmtFinType1, BsmtFinType2, Heating, HeatingQC, CentralAir, Electrical, KitchenQual, Functional, FireplaceQu, GarageType, GarageFinish, GarageQual, GarageCond, PavedDrive, PoolQC, Fence, MiscFeature, SaleType, SaleCondition

这是否意味着我应该在申请 my_model.fit() 之前预处理 X_valid 或者我做错了什么？

如果问题是我们需要在应用 fit() 之前预处理 X_valid 如何使用我在上面定义的预处理器来做到这一点？

编辑:我尝试在没有管道的情况下预处理 X_valid，但我收到错误消息，说功能不匹配。

最佳答案

问题是管道不适合 eval_set。所以，正如你所说，你需要预处理 X_valid。要做到这一点，最简单的方法是在没有“模型”步骤的情况下使用您的管道。在拟合管道之前使用以下代码:

# Make a copy to avoid changing original data
X_valid_eval=X_valid.copy()
# Remove the model from pipeline
eval_set_pipe = Pipeline(steps = [('preprocessor', preprocessor)])
# fit transform X_valid.copy()
X_valid_eval = eval_set_pipe.fit(X_train, y_train).transform (X_valid_eval)

然后在更改 model__eval_set 后适合您的管道，如下所示:

my_model.fit(X_train, y_train, model__early_stopping_rounds=5, model__eval_metric = "mae", model__eval_set=[(X_valid_eval, y_valid)])

关于python - 使用管道的 XGBRegressor，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/58136107/

24

4

0

文章推荐： reactjs - 显示不是直接子项的输入的选项卡表单验证

文章推荐： react-native - 搜索栏图标未显示 | react native

文章推荐： r - 如何在 R 中绘制迈阿密地 block (GWAS)？

python - 使用管道的 XGBRegressor
我正在使用 XGBRegressor 与管道。管道包含预处理步骤和模型 ( XGBRegressor )。以下是完整的预处理步骤。 (我已经定义了 numeric_cols 和 cat_cols)
python - XGBRegressor 评分方法返回奇怪的值
我尝试使用 Python API 中的 XGBRegressor 评分方法，它返回的结果为 0.917。我期望这是回归的 r2 分数。但是，在同一包上尝试 sklearn 的 r2_score 时，
python - 为什么 XGBRegressor 预测警告特征不匹配？
我想使用 XGBRegressor 来预测一些数据。所以我加载了训练数据和测试数据。 iowa_file_path = '../input/train.csv' test_data_path = '.
python - GridSearchCV:评分不使用选择的 XGBRegressor 评分方法
Scikit-learn GridSearchCV 用于 XGBRegressor 模型的超参数调整。独立于 XGBRegressor().fit() 中指定的 eval_metric，GridSea
python - 在 XGBoost.XGBRegressor 中创建自定义目标函数
所以我对 Python 中的 ML/AI 游戏相对较新，目前正在研究围绕 XGBoost 自定义目标函数实现的问题。我的微分方程知识相当生疏，所以我创建了一个带有梯度和粗麻布的自定义 obj 函数，
scikit-learn - XGBRegressor 比 GradientBoostingRegressor 慢得多
我是新来的 xgboost并试图通过将它与传统的 gbm 进行比较来学习如何使用它.但是，我注意到 xgboost比gbm慢得多.例子是: from sklearn.model_selection i
python - 属性错误: module ‘xgboost’ has no attribute ‘XGBRegressor’
我尝试使用spyder和python运行xgboost，但我不断收到此错误: 属性错误:模块“xgboost”没有属性“XGBRegressor” 代码如下: import xgboost as xg
python-3.x - XGBRegressor : change random_state no effect
xgboost.XGBRegressor尽管给出了新的随机种子，但似乎产生了相同的结果。根据xgboost文档 xgboost.XGBRegressor : seed : int Random nu
Python 的 XGBRegressor 与 R 的 XGBoost
我在同一数据集上使用具有相同参数的 python 的 XGBRegressor 和 R 的 xgb.train，但得到了不同的预测。我知道 XGBRegressor 使用“gbtree”，并且我已经
python - XGBoost 和 scikit 优化 : BayesSearchCV and XGBRegressor are incompatible - why?
我有一个非常大的数据集(700 万行，54 个特征)，我想使用 XGBoost 拟合回归模型。 .为了训练最好的模型，我想使用 BayesSearchCV来自 scikit-optimize对不同的超
python - 在某些情况下，Python 中 xgb.train 和 xgb.XGBRegressor 之间的差异是值
我注意到 Python 中的 XGBoost 有两种可能的实现，如所讨论的 here和 here 当我尝试通过两种可能的实现运行相同的数据集时，我注意到结果不同。代码 import xgboost
python - xgb.train 和 xgb.XGBRegressor(或 xgb.XGBClassifier)有什么区别？
我已经知道“xgboost.XGBRegressor 是 XGBoost 的 Scikit-Learn Wrapper 接口(interface)。” 但是它们还有什么不同吗？最佳答案 xgboos
python - GridSearchCV 在管道中将 fit_params 传递给 XGBRegressor 产生 "ValueError: need more than 1 value to unpack"
无论内容如何，将 fit_params 传递到包含 XGBRegressor 的管道都会返回错误训练数据集已经过热编码并被拆分以用于管道 train_X, val_X, train_y, val

首页

博学

6Ren·AI

商城

python - 使用管道的 XGBRegressor