r - 子集 ffdf 对象(子集 vs ffwhich)-6ren

r - 子集 ffdf 对象(子集 vs ffwhich)

转载作者：行者123 更新时间：2023-12-04 12:17:53

我正在执行大型 ffdf 对象的子集，我注意到当我使用 subset.ff 时，它会生成大量 NA。我通过使用 ffwhich 尝试了另一种方法，结果要快得多，并且没有生成 NA。这是我的测试:

library(ffbase)
# deals is the ffdf I would like to subset
unique(deals$COMMODITY)
ff (open) integer length=7 (7) levels: CASH CO2 COAL ELEC GAS GCERT OIL
  [1]   [2]   [3]   [4]   [5]   [6]   [7] 
CASH  CO2   COAL  ELEC  GAS   GCERT OIL   

# Using subset.ff
started.at=proc.time()
deals0 <- subset.ff(deals,deals$COMMODITY %in% c("CASH","COAL","CO2","ELEC","GCERT"))
cat("Finished in",timetaken(started.at),"\n")
Finished in 12.640sec
# NAs are generated
unique(deals0$COMMODITY)
ff (open) integer length=8 (8) levels: CASH CO2 COAL ELEC GAS GCERT OIL <NA>
  [1]   [2]   [3]   [4]   [5]   [6]   [7]   [8] 
CASH  CO2   COAL  ELEC  GAS   GCERT OIL   NA    

# Subset using ffwhich
started.at=proc.time()
idx <- ffwhich(deals,COMMODITY %in% c("CASH","COAL","CO2","ELEC","GCERT"))
deals1 <- deals[idx,]
cat("Finished in",timetaken(started.at),"\n")
Finished in 3.130sec
# No NAs are generated
unique(deals1$COMMODITY)
ff (open) integer length=7 (7) levels: CASH CO2 COAL ELEC GAS GCERT OIL
  [1]   [2]   [3]   [4]   [5]   [6]   [7] 
CASH  CO2   COAL  ELEC  GAS   GCERT OIL

知道为什么会这样吗？

最佳答案

subset.ff可能正在使用 [和您的标准，但不包括 !is.na(.)条款。 “[”的默认值是返回标准向量的 TRUE 或 NA 项。正则子集函数添加一个 !is.na(.)条款，但也许 ffbase 的作者没有解决这个问题。

关于r - 子集 ffdf 对象(子集 vs ffwhich)，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/13531265/

文章推荐： r - 如何根据聚集的人口找到指数

文章推荐： julia - 无法在VS Code中启动Julia语言服务器

文章推荐： r - 如何在 R 中的函数内操作全局环境？

R ff ffbase ffwhich 函数调用中的错误？
这是我在函数中调用 ffwhich 的代码: library(ffbase) rm(a,b) test a & x #1) : object 'a' not found traceback() 6:
r - 子集 ffdf 对象(子集 vs ffwhich)
我正在执行大型 ffdf 对象的子集，我注意到当我使用 subset.ff 时，它会生成大量 NA。我通过使用 ffwhich 尝试了另一种方法，结果要快得多，并且没有生成 NA。这是我的测试: li

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

r - 子集 ffdf 对象(子集 vs ffwhich)