gpt4 book ai didi

python - 为什么 XGBoost 拟合速度很慢,即使数据集非常小?

转载 作者:行者123 更新时间:2023-11-30 09:42:32 28 4
gpt4 key购买 nike

作为 Python 机器学习的新手,我正在尝试训练 XGBoost 模型来预测虹膜数据集 ( https://www.kaggle.com/uciml/iris )。

我目前专注于 XGBoost,试图获得一些经验。我的第一个模型训练,在 66% 的数据集上,只有 2 个特征,从未完成(20 分钟后中断)。我还尝试用它制作一个非常小的样本(5 个样本,2 个功能),但仍然无法完成。

环境详细信息:MacBook Pro 2017,配备 MacOS 10.14.5、Python 3.7.3(通过 Anaconda Navigator 1.9.7)。

# File downloaded from Kaggle Link above
iris = pd.read_csv('Iris.csv')
iris['Species'] = iris.apply(lambda r: r['Species'][5:], axis = 1)

features = iris[['PetalLengthCm', 'PetalWidthCm']]
species, labels = pd.factorize(iris['Species'])

X_train, X_test, y_train, y_test = train_test_split(features, species, test_size=0.33, random_state=42)

xgb_x_train = X_train.head()
xgb_y_train = y_train[:5]

print(xgb_x_train.shape)
print(len(xgb_y_train))
(5, 2)
5
xgbclf = xgb.XGBClassifier()
xgbclf.fit(xgb_x_train, xgb_y_train)

我希望上面的代码能够在“合理”的时间内(即少于 4-5 分钟)生成经过训练的模型(未进行微调,因为仅使用 5 个样本),但拟合阶段永远不会完成。

我是否做了一些极其错误的事情,可能会导致如此高的适应时间?

感谢您的每一个建议!马蒂亚

最佳答案

也许你没有正确安装Xgboost(我在windows中也遇到过一次),我建议尝试使用conda install重新安装。

但对于您的情况,您可以尝试在 google colab https://colab.research.google.com 上上传代码(他们给你一个免费的 GPU 并且一切都已经安装好了)。此训练只需几秒钟。

关于python - 为什么 XGBoost 拟合速度很慢,即使数据集非常小?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56912326/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com