gpt4 book ai didi

r - 是否有一个函数可以将一个大数据帧拆分为 n 个相同大小的较小数据帧(按行),并具有一个较小大小的 n+1 数据帧?

转载 作者:行者123 更新时间:2023-12-04 12:19:52 24 4
gpt4 key购买 nike

标题几乎说明了这一点。我有一个包含 7+ 百万行的数据框,对于我来说太大了,无法在机器崩溃的情况下进行分析。我想将它拆分为 100 个较小的数据帧,其中包含 70,000 行,并让第 101 个数据帧具有剩余的行(< 70,000)。这似乎非同小可。

我知道我可以手动计算 n+1 的大小数据框,删除它,然后使用 split功能如下:

d <- split(my_data_frame,rep(1:100,each=70,000))

但是我有多个大型数据框,并且进行所有这些计算很乏味。有替代的解决方案吗?

最佳答案

这样的事情怎么样:

df <- data.frame(x = 1:723500, y = runif(7235000))
split(df, rep(1:100, each = round(NROW(df) / 100, -4)))

或者抽象一些:
num_dfs <- 100
split(df, rep(1:num_dfs, each = round(NROW(df) / num_dfs, -4)))

您可能需要考虑 caret 中的一些内容。包如: caret::createFolds(df$x)

关于r - 是否有一个函数可以将一个大数据帧拆分为 n 个相同大小的较小数据帧(按行),并具有一个较小大小的 n+1 数据帧?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30832904/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com