gpt4 book ai didi

r - 如何为我的包按需下载数据?

转载 作者:行者123 更新时间:2023-12-04 15:40:06 30 4
gpt4 key购买 nike

我是一个 R 包的作者,它实现了文件加载器并运送了单元测试和示例中使用的示例文件,例如,如果您在 GNU R 中运行 example(func_from_mypackage)

CRAN 人员要求我“按需下载包数据”并将其托管在某个外部服务器上,因为它超过了 5 MB 的包大小限制。有没有标准的方法来做到这一点?

到目前为止我的想法:我可以创建一个函数 dl_data_if_not_available() 并在每个示例中将其作为第一件事调用。但是我应该在哪里下载数据呢?例如,下载到 $HOME/.mypackage/data/ 这样的地方是否可以接受?

我希望可以像包数据一样访问数据,例如:

some_file = system.file("extdata", "some_file.dta", package = "mypackage", mustWork = TRUE);

但是有没有办法下载到那个位置(我的包的包数据目录)?

编辑:明确一点:我希望用户每次都必须将数据下载到临时位置。我希望数据下载一次,然后存储。数据经常被需要,而且它们不会改变。

更新:我找到了一个用于 BioConductor 的包 BiocFileCache,它似乎可以满足我的需要——但用于 bioconductor,不适用于 CRAN。我还没有为 CRAN 找到类似的东西。也许我会删除我在 CRAN 上的包并转移到 bioconductor,或者保留两者并让人们使用 devtools::install_github() 我的包。

最佳答案

我一无所获,最终编写了自己的包来执行此操作。没什么特别的,但它确实有用,我提供了它以防其他人需要它:pkgfilecache package on CRAN , pkgfilecache code on github

关于r - 如何为我的包按需下载数据?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58119159/

30 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com