- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我检查了几个相关的问题是这样的
How to load data quickly into R?
我引用了评分最高的答案的特定部分
It depends on what you want to do and how you process the data further. In any case, loading from a binary R object is always going to be faster, provided you always need the same dataset. The limiting speed here is the speed of your harddrive, not R. The binary form is the internal representation of the dataframe in the workspace, so there is no transformation needed anymore
user@machine data$ pv mygraph.RData > /dev/null
1.22GB 0:00:03 [ 384MB/s] [==================================>] 100% `
>system.time(load('mygraph.RData'))
user system elapsed
178.533 16.490 202.662
save(g,file="test.RData",compress=F)
> system.time(load('test.RData'))
user system elapsed
126.254 2.701 128.974
system.time(saveRDS(g,file="test2.RData",compress=F))
user system elapsed
7.714 2.820 18.112
save
也存储了对象名称
> system.time(a<-readRDS('test2.RData'))
user system elapsed
41.902 2.166 44.077
最佳答案
save
默认情况下会压缩,因此解压缩该文件需要花费更多时间。然后,将较大的文件加载到内存需要更长的时间。您的pv
示例只是将压缩数据复制到内存中,这对您不是很有用。 ;-)
更新:
我测试了我的理论,但它是错误的(至少在我的配备3.3Ghz CPU和7200RPM HDD的Windows XP计算机上)。加载压缩文件的速度更快(可能是因为它减少了磁盘I / O)。
多余的时间花费在RestoreToEnv
(在saveload.c
中)和/或R_Unserialize
(在serialize.c
中)。因此,您可以通过更改这些文件来加快加载速度,或者使用saveRDS
将对象分别保存在myGraph.RData
中,然后以某种方式在多个R进程中使用loadRDS
将数据加载到共享内存中...
关于r - 加快RData加载,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11559628/
我有很多 .RData 文件,其中包含我在之前的分析中保存的一个数据框,并且每个加载的文件的数据框都具有相同的名称。因此,例如使用 load(file1.RData) 我得到一个名为 'df' 的数据
我有一个矩阵: mat<-matrix(data=1:30,ncol=10,nrow=3) 我想将其保存到 Rdata: save(mat, file="m.Rdata") 然后加载回来: m<-lo
我有大约 30 行代码可以做到这一点(获得 Z 分数): data$z_col1 <- (data$col1 - mean(data$col1, na.rm = TRUE)) / sd(data$co
有没有办法可以用另一个替换 .Rdata 文件中的表?我可以使用 edit(x) 命令来编辑它,但是手动执行此操作会花费大量时间;此外,我还没有找到向其中添加行的方法。 最佳答案 我认为您需要阅读一些
看完this question我试图清理我的工作区,发现每次打开 R 时,我最近删除的所有原始项目都会恢复。然后我检查了 .RData ,发现它在几周内没有被修改,尽管我反复保存了工作区图像。 .RD
假设我们有这种情况: 我有很多 .RData 文件,它们超过 100mb(无论如何,但很大)。 在每个 .RData 文件中都有一个名为“Dataset_of_interest”的数据集,它们都是我想
我要加载 PakPMICS2018bh.RData数据来自 https://github.com/myaseen208/PakPMICS2018Data/并使用以下代码引发错误: library(RC
当我们想要将全局环境保存到磁盘时,我们使用 save(list = ls(.GlobalEnv), file = "data.Rdata") - 好的。 当需要保存一个特定对象时,我们使用 save(
我想将数据保存到 .RData 文件中。 例如,我想将两个 csv 文件和一些信息保存到 1.RData 中。 这里,我有两个 csv 文件 1) file_1.csv contains object
我有一个 RData 文件,它变得太大,无法使用 load() 加载到我的计算机上。命令。它包含一个包含约 300 万个观测值和约 100 个变量的数据框。 我想要 加载文件,也许使用一些 bigda
我正在尝试保护我保存在 R 中的一些数据文件。有没有办法用密码保护 R 数据文件 (.Rdata) ? 谢谢 最佳答案 在同一脚本中创建文件后,您可以调用 GnuPG 以使用公钥加密来加密文件。这将另
我有一个函数,我必须将数据集传递给它。 loading <- function(dataset){ merchants <- load(dataset) return(merchants) } 但是当
当加载 .RData 文件时,每次都会生成相同的随机数。例如试试这个:(在终端中输入这些) rm(list=ls()) x=10 #Just some random value save.image(
我正在尝试将指定目录中所有 .RData 文件的data frame 对象的数据加载到单个数据表。这就是我尝试这样做的方式: library(data.table) fileList str(dat
我是 R 的新手,我正在尝试将 .Rdata 格式文件转换为逗号分隔的文本文件格式。有人可以帮我解决这个问题吗? 最佳答案 load("yourData.RData") ls() #returns a
我有一个包含各种对象的Rdata文件: New.Rdata |_ Object 1 (e.g. data.frame) |_ Object 2 (e.g. matrix) |_...
我必须加载 isfar.RData 文件才能将其用于其他计算(此处描述并不重要)。我想简单地看看 isfar.RData 文件中的数据如何,例如它携带什么数字、列、行。 首先我加载我的文件: isfa
我有一个矢量 a=0.01 然后我创建一个 mat a = 1 > get('a') [1] 1 与save一起使用: to_be_saved_obj = paste("mat", a, sep =
我发现自己需要更新之前使用 save 创建的 Rdata 文件中的一两个数据对象。如果我不小心加载文件,我可能会忘记重新保存文件中的一些对象。举个例子,我正在开发一个包,其中包含一些存储在 sysda
如果您尝试将任何数据集保存到“PRN.rData”,您将收到错误消息: d<- data.frame(D=NA, K=NA) save(d, file="E:/PRN.rData") Error in
我是一名优秀的程序员,十分优秀!