gpt4 book ai didi

python - 将稀疏矩阵 (csc_matrix) 转换为 pandas 数据帧

转载 作者:太空狗 更新时间:2023-10-29 18:02:10 24 4
gpt4 key购买 nike

我想将这个矩阵转换为 Pandas 数据框。 csc_matrix

括号中的第一个数字应该是索引第二个数字是和< strong>最后的数字是数据

我想这样做是为了在文本分析中进行特征选择,第一个数字代表文档,第二个数字是单词的特征,最后一个数字是 TFIDF 分数。

获取数据框帮助我将文本分析问题转化为数据分析。

最佳答案

from scipy.sparse import csc_matrix

csc = csc_matrix(np.array(
[[0, 0, 4, 0, 0, 0],
[1, 0, 0, 0, 2, 0],
[2, 0, 0, 1, 0, 0],
[0, 0, 0, 0, 0, 1],
[4, 0, 3, 2, 0, 0]]))

# Return a Coordinate (coo) representation of the Compresses-Sparse-Column (csc) matrix.
coo = csc.tocoo(copy=False)

# Access `row`, `col` and `data` properties of coo matrix.
>>> pd.DataFrame({'index': coo.row, 'col': coo.col, 'data': coo.data}
)[['index', 'col', 'data']].sort_values(['index', 'col']
).reset_index(drop=True)
index col data
0 0 2 4
1 1 0 1
2 1 4 2
3 2 0 2
4 2 3 1
5 3 5 1
6 4 0 4
7 4 2 3
8 4 3 2

关于python - 将稀疏矩阵 (csc_matrix) 转换为 pandas 数据帧,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36587702/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com