gpt4 book ai didi

r - 将 R 中的机器学习包应用于大型数据集

转载 作者:行者123 更新时间:2023-11-30 09:27:16 25 4
gpt4 key购买 nike

我有一个大约 1GB 的数据集,它不适合内存(因为当我们在 R 中应用 LM 时,它还会创建其他消耗内存的变量)。我想知道是否有办法在这种情况下仍然使用 R 中那些不错的机器学习包(例如,glm、随机森林、神经网络)来进行分析?我感谢任何建议和引用。

最佳答案

请参阅high-performance task view on CRAN ,特别是有关大内存和内存不足数据的部分。

或者:您可能需要付费,但请考虑使用 Microsoft R Server 。 MRS 以前称为 Revolution R Enterprise,旨在打破处理大型数据集时的内存障碍。它适用于 Windows 和 Linux,还允许使用 SQL Server、Teradata、Hadoop(Cloudera、Hortonworks 和 HDInsight)和 Spark 进行数据库内分析。

披露:我是 Microsoft 员工。

关于r - 将 R 中的机器学习包应用于大型数据集,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40679487/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com