gpt4 book ai didi

python - LDA 处理失败,python 中出现 "Variables are collinear."错误

转载 作者:行者123 更新时间:2023-11-28 21:38:59 26 4
gpt4 key购买 nike

我正在使用 Python 3.6.1 | python 4.4.0

我是 ML 新手,边学边练习。我拿起一个kagle数据集来练习LDA进行降维。出现了两个困惑:

  1. 我开始收到警告错误“变量共线”。
  2. 即使我将 n 分量用作 2,输出向量 x_train 仍然只显示 1 个特征。

代码:

import numpy as np
import matplotlib.pyplot as plt
import pandas as pd

datasets = pd.read_csv('mushrooms.csv')
X_df = datasets.iloc[:, 1:] # Independent variables
y_df = datasets.iloc[:, 0] # Dependent variables

from sklearn.preprocessing import LabelEncoder, OneHotEncoder
X_df = X_df.apply(LabelEncoder().fit_transform)
x = OneHotEncoder(sparse=False).fit_transform(X_df.values)
y = LabelEncoder().fit_transform(y_df.values)

# Splitting dataset in to training set and test set.
from sklearn.model_selection import train_test_split
x_train,x_test,y_train,y_test =
train_test_split(x,y,test_size=0.2,random_state=0)
# Feature scaling
from sklearn.preprocessing import StandardScaler
sc_x = StandardScaler()
x_train = sc_x.fit_transform(x_train)
x_test = sc_x.transform(x_test)

#---------------------------------------------
# Applying LDA (Linear Discriminant Analysis)
#---------------------------------------------

from sklearn.discriminant_analysis import LinearDiscriminantAnalysis as LDA
lda = LDA(n_components = 2)
x_train = lda.fit_transform(x_train, y_train)
x_test = lda.transform(x_test)

最佳答案

这表明了错误消息所说的内容:您的一些变量是共线的。换句话说,一个向量的元素是另一个向量元素的线性函数,例如

0, 1, 2, 3
3, 5, 7, 9

在这种情况下,LDA 无法区分他们对世界其他地方的影响。

我无法诊断出任何具体的问题,因为您未能提供建议的 MCVE。

关于python - LDA 处理失败,python 中出现 "Variables are collinear."错误,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47425694/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com