gpt4 book ai didi

python - 值错误 : Unknown label type: 'unknown'

转载 作者:IT老高 更新时间:2023-10-28 22:20:15 29 4
gpt4 key购买 nike

我尝试运行以下代码。顺便说一句,我对 python 和 sklearn 都是新手。

import pandas as pd
import numpy as np
from sklearn.linear_model import LogisticRegression


# data import and preparation
trainData = pd.read_csv('train.csv')
train = trainData.values
testData = pd.read_csv('test.csv')
test = testData.values
X = np.c_[train[:, 0], train[:, 2], train[:, 6:7], train[:, 9]]
X = np.nan_to_num(X)
y = train[:, 1]
Xtest = np.c_[test[:, 0:1], test[:, 5:6], test[:, 8]]
Xtest = np.nan_to_num(Xtest)


# model
lr = LogisticRegression()
lr.fit(X, y)

其中 y 是 0 和 1 的 np.ndarray

我收到以下信息:

File "C:\Anaconda3\lib\site-packages\sklearn\linear_model\logistic.py", line >1174, in fit check_classification_targets(y)

File "C:\Anaconda3\lib\site-packages\sklearn\utils\multiclass.py", line 172, >in check_classification_targets raise ValueError("Unknown label type: %r" % y_type)

ValueError: Unknown label type: 'unknown'

来自 sklearn 文档:http://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html#sklearn.linear_model.LogisticRegression.fit

y : 类似数组,形状 (n_samples,)目标值(分类中的类标签,回归中的实数)

我的错误是什么?

更新:

y 是数组([0.0, 1.0, 1.0, ..., 0.0, 1.0, 0.0], dtype=object) 大小是 (891,)

最佳答案

您的 y 属于 object 类型,因此 sklearn 无法识别其类型。在行 y = train[:, 1] 之后添加行 y=y.astype('int')

关于python - 值错误 : Unknown label type: 'unknown' ,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45346550/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com