gpt4 book ai didi

python - 哪个 SciPy 稀疏矩阵类最适合计算距离矩阵?

转载 作者:太空宇宙 更新时间:2023-11-04 05:56:59 25 4
gpt4 key购买 nike

我有一个相对较大的 NumPy 数组(近 30 万行和 20 多列,尽管大多数值为 0)我需要使用 scikit-learn 的 pairwise_distances 计算距离矩阵功能。

不幸的是,除非我将输入数组转换为稀疏矩阵,否则此过程会遇到内存错误。 SciPy 提供了许多 sparse matrix classes而且我不知道哪个最适合这种特定情况。

我找到了一个 SO answer有利于 CSR 或 CSC,但我不清楚哪一个最适合计算距离矩阵。欢迎提出任何建议!

最佳答案

CSR 按行排序,CSC 按列排序。因此,使用 CSR 访问行会更快,使用 CSC 访问列会更快。由于 sklearn.metrics.pairwise.pairwise_distances 使用 X 作为输入,其中行是实例,列是属性,它将访问稀疏矩阵中的行。因此,使用 CSR 可能更有效。

关于python - 哪个 SciPy 稀疏矩阵类最适合计算距离矩阵?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27235744/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com