gpt4 book ai didi

python - 用 pandas 和 numpy 解析冒号分隔的稀疏数据

转载 作者:太空宇宙 更新时间:2023-11-04 01:15:05 25 4
gpt4 key购买 nike

我想在 pandas/numpy 中解析格式为 col_index:value 的数据文件。例如:

0:23 3:41
1:31 2:65

将对应于这个矩阵:

[[23 0 0 41]
[0 31 65 0]]

这似乎是在文件中表示稀疏数据的一种非常常见的方法,但我找不到一种简单的方法来解析它,而不必在调用 read_csv 后进行某种迭代。

最佳答案

我最近发现这实际上是 svm-light 格式,您可以使用像这样的 svm 加载器读取这样的数据集:

http://scikit-learn.org/stable/modules/generated/sklearn.datasets.load_svmlight_file.html

关于python - 用 pandas 和 numpy 解析冒号分隔的稀疏数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25122152/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com