gpt4 book ai didi

python - mlpy 的 scipy.sparse.csc_matrix 格式

转载 作者:行者123 更新时间:2023-11-30 09:57:53 24 4
gpt4 key购买 nike

我想知道是否有任何方法可以在 python 中为 mlpy 提供 scipy.sparse.csc_matrix 格式。我以前使用过 mlpy 并且一直处理非稀疏矩阵。例如,如果我每行有 5 个特征和 1 个标签(0 或 1),我会得到如下所示的内容:

2,3,4,5,6,0

1,2,3,4,5,1
.....

现在,对于我的下一个项目,我有大约 20,000 个大量特征,因此在这种情况下创建稀疏矩阵会容易得多。

我查看了 k-means 聚类的 mlpy 文档(因为我现在要做的就是对数据进行聚类),它 says :

Parameters :    
x : 2d array_like object (N, P)
data
k : int (1<k<N)
number of clusters
plus : bool
k-means++ algorithm for initialization
seed : int
random seed for initialization
Returns :
clusters, means, steps: 1d array, 2d array, int
cluster membership in 0,...,K-1, means (K,P), number of steps

我认为这意味着 mlpy 仅接受非稀疏矩阵。如果我读错了什么,请告诉我。

任何帮助将不胜感激。谢谢!

最佳答案

我认为答案很简单,MLPy 中的 kmeans 不适用于稀疏输入。编写一个处理稀疏输入的算法并不简单。

MiniBatchKMeansscikit-learn适用于稀疏输入(免责声明:我是 scikit-learn 开发人员)。

关于python - mlpy 的 scipy.sparse.csc_matrix 格式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9715307/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com