gpt4 book ai didi

r - 在生产环境中运行的最佳实践 R 脚本 - 包版本

转载 作者:行者123 更新时间:2023-12-02 09:26:59 25 4
gpt4 key购买 nike

我们有一个 Linux (Ubuntu 14.10) 生产服务器,以及我们编写的许多 R 脚本,我们希望在其上运行这些脚本,这些脚本将从 API 或网络抓取中收集数据。然后数据将写入 CSV 文件。

我的背景是 SQL Server/Fortran,并且在生产环境中应该遵循非常具体的最佳实践。一些突出的问题是:-

  • 生产环境在版本控制方面应该稳定,无论是从代码的角度来看,还是从安装的应用程序、操作系统等角度来看。
  • 对代码/应用程序/操作系统的更改应在单独的环境中或以受控且可撤销的方式进行。如果存在第二个环境,则可以执行并行执行来测试系统更改。
  • (很大程度上)开发人员无法更改生产环境。

我的问题是这样的:如何确保与我的 R 代码关联的包保持一致且不变,直到我选择更新它们?

最佳答案

你可以使用 Docker;我们的Rocker project有一些合适的容器可以启动。

否则只需使用基本的 Unix sys.admining:

  • 如果您不想更改 R 的包目录,请将其设置为只读
  • 也许可以使用 HPC 人员的一些技巧,并使用“模块”(即符号链接(symbolic link)层或路径设置)来使某些路径和目录可见或不可见

一般来说,Task View on Reproducible Research有一些进一步的指示。您可以在每次生产运行中记录所使用的版本,并且可以以可以将版本与预期版本进行比较的方式设置运行。

但是这些对于 R 来说都不是真正的——这些都是部署的“元”问题。

关于r - 在生产环境中运行的最佳实践 R 脚本 - 包版本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36925855/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com