gpt4 book ai didi

python - 使用 Pandas 加载数据并使用 SkLearn 执行 LDA

转载 作者:行者123 更新时间:2023-11-30 08:54:53 26 4
gpt4 key购买 nike

我对使用 python 进行数据挖掘非常陌生。我需要对数据集实现线性判别分析,如下所示:

0.38769,0.50132,1
-0.86481,0.10141,1
-0.19577,0.22167,1
0.015502,0.1554,2

其中最后一位数字是标签。我使用 sklearn 和 pandas 来加载我的数据。我这样加载:

import numpy as np
import pandas as pd
import matplotlib as plt

from sklearn.lda import LDA

data = pd.read_csv('data.txt')
print data

所以当我打印数据时,它看起来像这样:

0    -0.864810  0.101410  1
1 -0.195770 0.221670 1
2 0.015502 0.155400 1

我在sklearn官方网站上找到了LDA示例:

>>> import numpy as np
>>> from sklearn.lda import LDA
>>> X = np.array([[-1, -1], [-2, -1], [-3, -2], [1, 1], [2, 1], [3, 2]])
>>> y = np.array([1, 1, 1, 2, 2, 2])
>>> clf = LDA()
>>> clf.fit(X, y)
LDA(n_components=None, priors=None, shrinkage=None, solver='svd',
store_covariance=False, tol=0.0001)
>>> print(clf.predict([[-0.8, -1]]))

从这个例子中,我认为我需要将标签放在单独的矩阵(y)中,但此时我陷入困境。我不知道下一步该去哪里。我阅读了 pandas 和 sklearn 的文档,但它们没有告诉我任何信息。您能否通过提供指导和可能的示例来帮助我。

最佳答案

这是你想做的吗?

data = pd.read_csv('data.txt',names=['X1','X2','Y'])
clf = LDA()
clf.fit(data.loc[:,'X1':'X2'].values, data.Y)

关于python - 使用 Pandas 加载数据并使用 SkLearn 执行 LDA,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35200046/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com