gpt4 book ai didi

python - 使用 RFC 求解泰坦尼克号(Kaggle)数据集,未知标签类型 : 'unknown'

转载 作者:太空宇宙 更新时间:2023-11-03 21:08:42 24 4
gpt4 key购买 nike

我正在使用 RFC 求解泰坦尼克号 Kaggle 数据集,但在将数据拟合到模型时收到错误消息“未知标签类型:‘未知’”。我觉得错误在 y 中,但我找不到任何东西。

data = pd.read_csv('train.csv')
data = data.fillna(data.mean())
data = data.replace('male',1)
data = data.replace('female',0)
data = data.replace('S',0)
data = data.replace('C',1)
data = data.replace('Q',2)
data['Embarked'] = data['Embarked'].fillna('S')
data = data[data.Embarked != 'S']
y = data.Survived
np.unique(y)
features = ['Pclass','Sex','Age','Fare','SibSp','Parch','Embarked']
X = data[features]
trainX,trainY,valX,valY = train_test_split(X,y,random_state = 1)
titanmodel = RandomForestClassifier(random_state = 1)
titanmodel.fit(trainX,trainY)

出现错误的模型拟合部分
ValueError:未知标签类型:'未知'
另外,如果您有任何更好的技巧来解决这个问题,请告诉我们。提前致谢

最佳答案

train_test_split()的结果是 X_train、X_test、y_train、y_test 并且您在代码中以不同的顺序分配值。

更改行:

trainX,trainY,valX,valY = train_test_split(X,y,random_state = 1)  

通过这个:

trainX,valX,trainY,valY = train_test_split(X,y,random_state = 1)  

您将能够使用正确的参数来拟合模型。

关于python - 使用 RFC 求解泰坦尼克号(Kaggle)数据集,未知标签类型 : 'unknown' ,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55212118/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com