gpt4 book ai didi

r - R中的大数据内存问题

转载 作者:行者123 更新时间:2023-11-30 08:35:24 25 4
gpt4 key购买 nike

我已经在 R 中创建了一个 tdm 矩阵,我想将其写入文件。这是一个简单三元组形式的大型稀疏矩阵,约 20,000 x 10,000。当我将其转换为密集矩阵以通过 cbind 添加列时,出现低内存错误,并且该过程无法完成。我不想增加内存。

另外,我想 -- 将 tf 和 tfidf 矩阵绑定(bind)在一起- 将稀疏/密集矩阵保存到csv- 运行批处理机器学习算法,例如 weka 的 J48 实现。

如何在内存限制内保存/加载数据集并运行批量机器学习算法?

如果我可以将稀疏矩阵写入数据存储,我可以在 R 中在稀疏矩阵上并在内存限制内运行机器学习算法吗?

最佳答案

可能有多种解决方案:

1) 如果您正在处理整数,请将矩阵从 double 转换为整数。与 double 相比,整数需要更少的内存。

2) 尝试 bigmemory包。

关于r - R中的大数据内存问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21528752/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com