- mongodb - 在 MongoDB mapreduce 中,如何展平值对象?
- javascript - 对象传播与 Object.assign
- html - 输入类型 ="submit"Vs 按钮标签它们可以互换吗?
- sql - 使用 MongoDB 而不是 MS SQL Server 的优缺点
我注意到 Pandas 现在有 support for Sparse Matrices and Arrays .目前,我像这样创建 DataFrame()
:
return DataFrame(matrix.toarray(), columns=features, index=observations)
有没有办法用 scipy.sparse.csc_matrix()
或 csr_matrix()
创建一个 SparseDataFrame()
?转换为密集格式会严重破坏 RAM。谢谢!
最佳答案
ATM 不支持直接转换。欢迎投稿!
试试这个,在内存上应该没问题,因为 SpareSeries 很像 csc_matrix(1 列)并且非常节省空间
In [37]: col = np.array([0,0,1,2,2,2])
In [38]: data = np.array([1,2,3,4,5,6],dtype='float64')
In [39]: m = csc_matrix( (data,(row,col)), shape=(3,3) )
In [40]: m
Out[40]:
<3x3 sparse matrix of type '<type 'numpy.float64'>'
with 6 stored elements in Compressed Sparse Column format>
In [46]: pd.SparseDataFrame([ pd.SparseSeries(m[i].toarray().ravel())
for i in np.arange(m.shape[0]) ])
Out[46]:
0 1 2
0 1 0 4
1 0 0 5
2 2 3 6
In [47]: df = pd.SparseDataFrame([ pd.SparseSeries(m[i].toarray().ravel())
for i in np.arange(m.shape[0]) ])
In [48]: type(df)
Out[48]: pandas.sparse.frame.SparseDataFrame
关于python - 从 SciPy 稀疏矩阵填充 Pandas SparseDataFrame,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17818783/
我有一个 SQL 表,我可以将其作为 Pandas 数据框读入,它具有以下结构: user_id value 1 100 1 200 2 1
我正在尝试将 Python 字典列表转换为 Pandas DataFrame . 由于每个dict都有不同的key,占用内存太多。由于大多数值都是 NaN,所以 SparseDataFrame在这种情
有人曾经有效地序列化/反序列化 pandas SparseDataFrame 吗? import pandas as pd import scipy from scipy import sparse
我想用 Dimonson 250.000 x 250.000 创建一个 pandas SparseDataFrame。最后我的目标是想出一个大的邻接矩阵。 到目前为止,创建该数据框没有问题: df =
pandas.DataFrame(a) Out[41]: 1 2 3 0 1 2 NaN 1 1 NaN 3 a = [{1:1.0,2:2.0}, {1:1.0,3:3.0
我有一个很高的(2743470 行,2 列)DataFrame,将其称为 df,具有以下列,整数索引: | item | user | | 1 | abc | | 15 | abc |
在机器学习库 H2O 的 Python API 中,将稀疏 Pandas DataFrame 对象转换为 H2OFrame 对象的正确方法是什么? 最佳答案 recommended way似乎是将数据
我有一个密度非常低(设置了 0.1% 的条目)的大型 SparseDataFrame(例如,20k 索引 x 10k 列)。我正在尝试访问特定的行数据框,但我似乎做不到。虽然访问列很好。这是一个说明问
我注意到 Pandas 现在有 support for Sparse Matrices and Arrays .目前,我像这样创建 DataFrame(): return DataFrame(matr
用示例更新了问题 我尝试重现我的问题。事实证明,它甚至与我的数据集的大小无关。这是重现我的问题的最小示例: >>> import pandas as pd >>> data = pd.SparseDa
当前 Pandas 版本:0.22 我有一个 SparseDataFrame。 A = pd.SparseDataFrame( [['a',0,0,'b'], [0,0,0,'c']
(这个问题与 "populate a Pandas SparseDataFrame from a SciPy Sparse Matrix" 相关。我想从 scipy.sparse.coo_matrix
我想将 pandas SparseDataFrame 转换为 scipy.sparse.csc_matrix。但我不想先将其转换回稠密矩阵。 现在我有类似下面的内容。 df = pd.get_dumm
我是一名优秀的程序员,十分优秀!