gpt4 book ai didi

python-3.x - 逻辑回归,混淆矩阵第二列显示零

转载 作者:行者123 更新时间:2023-11-30 08:45:38 25 4
gpt4 key购买 nike

我想使用逻辑回归来查看银行账户余额、人的年龄和买房能力之间的相关性。实现回归模型后,我得到了以下类型的混淆矩阵:

array([[1006,    0],
[ 125, 0]])

当我尝试对其他数据实现线性回归时就是这种情况。这是代码:

# importing dataset
dataset = pd.read_csv('/home/stayal0ne/Machine-learning/datasets/bank.csv', sep=';')
dataset['age'] = dataset['age'].astype(float)
dataset['balance'] = dataset['balance'].astype(float)
X = dataset.iloc[:, [0, 5]].values
y = dataset.iloc[:, -1].values

# splitting the dataset into the training and test sets
X_train, X_test, y_train, y_test = train_test_split(
X, y, test_size=0.25, random_state=42)

# encoding categorial data
label_encoder_y = LabelEncoder()
y = label_encoder_y.fit_transform(y)

# feature scaling
scale = StandardScaler()
X_train = scale.fit_transform(X_train)
X_test = scale.transform(X_test)

# Fitting classifier into the training set
classifier = LogisticRegression(random_state=42)
classifier.fit(X_train, y_train)

# Prediction
y_predicted = classifier.predict(X_test)

# Checking the accuracy
con_matrix = confusion_matrix(y_test, y_predicted)

任何帮助将不胜感激。

最佳答案

con_matrix 的数组如下,tn, fp, fn, tp。

你的真实负数是 1006,这意味着模型认为没有能力买房的人,您的误报为 0,这意味着您的模型没有预测某人能够买房,而现实中却不能。

你的假阴性是 125,这意味着这些人实际上有能力买房子,但你的模型说他们可以。并且您的真实积极值也是 0,这意味着您的模型没有正确地将有能力买房的人预测为真正有能力买房的人。

我的总体猜测是,与可以买房的人相比,可能有很多人买不起房子,而且两者的特征(银行余额、年龄)可能相似。

我建议你添加class_weight参数,以防数据集不平衡,如果类别标签为0表示不能买房,然后设置{0: 0.1},以防你有90条不能买房的记录买房和10条能买房的记录

关于python-3.x - 逻辑回归,混淆矩阵第二列显示零,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50458383/

25 4 0
文章推荐: javascript - 选择不正确的值 HTML