gpt4 book ai didi

python - 逻辑回归 - ValueError : classification metrics can't handle a mix of continuous-multi output and binary targets

转载 作者:行者123 更新时间:2023-11-30 09:24:54 24 4
gpt4 key购买 nike

我是一名数据科学菜鸟,正在研究 Kaggle Titanic dataset 。我正在对其运行逻辑回归,以预测测试数据集中的乘客是生存还是死亡。

我清理了训练和测试数据,并对训练数据运行逻辑回归拟合。一切都好。

train = pd.read_csv('train.csv')    
X_train = train.drop('Survived',axis=1)
y_train = train['Survived']
from sklearn.linear_model import LogisticRegression
logmodel = LogisticRegression()
logmodel.fit(X_train,y_train)

然后我对测试数据运行预测模型,如下所示:

test = pd.read_csv('test.csv') 
predictions = logmodel.predict(test)

然后我尝试打印混淆矩阵:

from sklearn.metrics import classification_report, confusion_matrix
print(confusion_matrix(test,predictions))

我收到一条错误消息:

ValueError: Classification metrics can't handle a mix of continuous-multioutput and binary targets

这是什么意思以及如何解决它?

我看到的一些潜在问题是:

  1. 我对测试数据的预测模型做了一些非常愚蠢和错误的事情。
  2. “年龄”和“票价”特征的值(乘客的费用)Ticket) 为 float ,其余为整数。

我哪里出错了?感谢您的帮助!

最佳答案

正如 m-dz 所评论的,confusion_matrix expects 2 arrays ,而在您的代码中,您传递了整个 test 数据帧。

此外,另一个common mistake不尊重参数的顺序,这很重要。

总而言之,你应该要求

confusion_matrix(test['Survived'], predictions)

关于python - 逻辑回归 - ValueError : classification metrics can't handle a mix of continuous-multi output and binary targets,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47185586/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com