gpt4 book ai didi

r - h2o.importFile() 不在 R 中导入完整的数据帧

转载 作者:行者123 更新时间:2023-12-04 12:05:08 25 4
gpt4 key购买 nike

我有一个 50 行(主题)和 572288 列(变量)的数据框

当将 data.frame 解析为 h2o 对象时,我丢失了变量并最终得到51 行和 419431 个变量。

如果我减少或增加行数,它不会改变。

library("data.table")
library("h2o")
options("h2o.use.data.table"=T)
h2o.init()
trainset=as.data.frame(matrix(ncol=572288,nrow=50,1))
fwrite(trainset, "train.csv", sep=",")
train=h2o.importFile("train.csv", sep=",")
dim(trainset)
dim(train)

我的输出是:

> h2o.init()
Connection successful!

R is connected to the H2O cluster:
H2O cluster uptime: 1 hours 2 minutes
H2O cluster timezone: Europe/Berlin
H2O data parsing timezone: UTC
H2O cluster version: 3.18.0.11
H2O cluster version age: 3 months
H2O cluster name: H2O_started_from_R_chiocchetti_lub856
H2O cluster total nodes: 1
H2O cluster total memory: 9.84 GB
H2O cluster total cores: 24
H2O cluster allowed cores: 20
H2O cluster healthy: TRUE
H2O Connection ip: localhost
H2O Connection port: 54321
H2O Connection proxy: NA
H2O Internal Security: FALSE
H2O API Extensions: XGBoost, Algos, AutoML, Core V3, Core V4
R Version: R version 3.4.3 (2017-11-30)

> trainset=as.data.frame(matrix(ncol=572288,nrow=50,1))
> fwrite(trainset, "train.csv", sep=",")
>
> train=h2o.importFile("train.csv", sep=",")
|======================================================================|100%
> dim(train)
[1] 51 538177
> dim(trainset)
[1] 50 572288

在我看来,我在从文件中读回行时遇到了某种内存问题。但是,我不知道如何克服这个问题。

最终目的是做一个randomForest。

最佳答案

这可能是一个错误;我在这里为它创建了一个 jira 票证:https://0xdata.atlassian.net/browse/PUBDEV-5860 .

如果您有 jira 帐户,请随时更新工单。

关于r - h2o.importFile() 不在 R 中导入完整的数据帧,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52009091/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com