gpt4 book ai didi

python - 如何在 scikit-learn 中实现多项式逻辑回归?

转载 作者:行者123 更新时间:2023-11-28 21:32:43 24 4
gpt4 key购买 nike

我正在尝试创建非线性逻辑回归,即使用 scikit-learn 的多项式逻辑回归。但是我找不到如何定义多项式的次数。有人试过吗?非常感谢!

最佳答案

为此,您需要分两步进行。让我们假设您正在使用 iris 数据集(因此您有一个可重现的示例):

from sklearn.datasets import load_iris
from sklearn.linear_model import LogisticRegression
from sklearn.preprocessing import PolynomialFeatures
from sklearn.model_selection import train_test_split
from sklearn.pipeline import Pipeline

data = load_iris()
X = data.data
y = data.target
X_train, X_test, y_train, y_test = train_test_split(X, y)

第一步

首先,您需要将数据转换为多项式特征。最初,我们的数据有 4 列:

X_train.shape
>>> (112,4)

您可以使用 scikit learn 创建多项式特征(此处为 2 阶):

poly = PolynomialFeatures(degree = 2, interaction_only=False, include_bias=False)
X_poly = poly.fit_transform(X_train)
X_poly.shape
>>> (112,14)

我们知道有 14 个特征(原来的 4 个,它们的正方形,以及 6 个交叉组合)

第二步

在此基础上,您现在可以构建逻辑回归调用 X_poly

lr = LogisticRegression()
lr.fit(X_poly,y_train)

注意:如果您随后想在测试数据上评估您的模型,您还需要按照以下 2 个步骤进行操作:

lr.score(poly.transform(X_test), y_test)

将所有内容放在管道中(可选)

您可能希望使用管道来代替在一个对象中处理这两个步骤以避免构建中间对象:

pipe = Pipeline([('polynomial_features',poly), ('logistic_regression',lr)])
pipe.fit(X_train, y_train)
pipe.score(X_test, y_test)

关于python - 如何在 scikit-learn 中实现多项式逻辑回归?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55937244/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com