gpt4 book ai didi

r - 如何在Dockerfile中的多个CMD语句之间保留R工作区?

转载 作者:行者123 更新时间:2023-12-02 19:48:55 26 4
gpt4 key购买 nike

我正在创建一个docker容器来接受来自客户端的输入数据,然后提供一个R脚本,该脚本对给定数据进行分析,并将三个图以PDF格式输出到工作目录。我遇到了在Dockerfile中需要两个CMD语句的问题,这是Docker Engine不允许的。我需要在运行时读取用户数据,以便可以根据用户更改数据集。然后,在将用户的数据作为R对象中的表对象读入后,就需要获取R脚本。发生的是,数据读得很好,但是出现一条错误消息,指示用于提供R脚本的第二条CMD行找不到刚刚读入的数据。我理解这是因为Dockerfile的每一行在构建时单独执行,但我不知道如何解决。我研究了数量,主管的使用以及使用多个容器的可能性。我也可以制作一个Python脚本来对R脚本进行动态编程,但是仍然需要两条CMD行。我还没有找到足以说明我情况的示例。你们每个人将如何解决这个问题?

这是我的R脚本,用于从数据框“x”创建3个图:

library(iq)
norm_data <- iq::preprocess(x, median_normalization = FALSE, pdf_out = NULL)
protein_list <- iq::create_protein_list(norm_data)

# basic protein plot
pdf(file = "Protein P00366.pdf")
iq::plot_protein(protein_list$P00366, main = "Protein P00366", split = NULL)
dev.off()

protein_table <- iq::create_protein_table(protein_list)

#MaxLFQ plot
pdf(file = "MaxLFQ quantification of P00366.pdf")
iq::plot_protein(rbind(protein_list$P00366,
MaxLFQ = iq::maxLFQ(protein_list$P00366)$estimate),
main = "MaxLFQ quantification of P00366",
col = c(rep("gray", nrow(protein_list$P00366)), "green"),
split = NULL)
dev.off()

# ground truth
MaxLFQ_estimate <- iq::maxLFQ(protein_list$P12799)$estimate

ground_truth <- log2(rep(c(200, 125.99, 79.37, 50, 4, 2.52, 1.59, 1), each = 3))
ground_truth <- ground_truth - mean(ground_truth) + mean(MaxLFQ_estimate)

#ground truth plot
pdf(file = "P12799 MaxLFQ versus groundtruth.pdf")
iq::plot_protein(rbind(MaxLFQ = MaxLFQ_estimate,
Groundtruth = ground_truth),
main = "P12799 - MaxLFQ versus groundtruth",
split = 0.75,
col = c("green", "gold"))
dev.off()


这是我的Dockerfile:
FROM r-base:latest

ENV SCRIPT=""
ENV DATA=""

RUN R -e "install.packages('iq', repos='http://cran.rstudio.com/')"

WORKDIR /home/iq/

CMD R -e "x <- read.table(\"$DATA\", header = TRUE, sep = ",", fill = TRUE)" \
&& R -e "source('$SCRIPT')"

在具有路径/ home / iq的文件夹中,我有名为iqTest.R,Dockerfile和data.csv的脚本。
我已经使用以下命令构建和运行容器:
$ cd iq
$ docker build -t my_image .
$ docker run -it -v /home/user/iq:/home/iq --env DATA=data.csv --env SCRIPT=iqTest.R my_image:latest

尝试运行后,我从R工作区收到以下错误消息:
> source('iqTest.R')
Error in iq::preprocess(x, median_normalization = FALSE, pdf_out = NULL) :
object 'x' not found
Calls: source -> withVisible -> eval -> eval -> <Anonymous>

编辑:我最近发现问题与R有关:您可以使用 ;在一行中连接多行R代码,从而解决了多个CMD语句的问题。以此为任何将R和Docker连接的人的榜样。
例如,新的带有分号链接行的Dockerfile:
FROM r-base:latest

ENV SCRIPT=""
ENV DATA=""

RUN mkdir /home/analysis/

RUN R -e "install.packages('iq', repos='http://cran.rstudio.com/')"

WORKDIR /home/analysis/

CMD R -e "x = read.csv(\"$DATA\", header = TRUE, sep = ",", fill = TRUE); source('$SCRIPT')"

最佳答案

如果您想通过环境变量来配置数据路径,那么我建议使用 Sys.getenv() 在脚本中访问该变量。这也使您可以使用Rscript而不是R -e "source...

这是对我有用的东西:

脚本。R

cat(Sys.getenv('SCRIPT'), '\n');
cat(Sys.getenv('DATA'), '\n')

Dockerfile
FROM r-base:latest

ENV SCRIPT="script.R"
ENV DATA="data.csv"

WORKDIR /workspace

CMD R -q -e "source('$SCRIPT')"
# alternative: CMD Rscript $SCRIPT

用法
daniel@nuest /tmp/stackoverflow []$ docker build --tag stackoverflow .
Sending build context to Docker daemon 4.608kB
Step 1/5 : FROM r-base:latest
---> 46edce0e80af
Step 2/5 : ENV SCRIPT="script.R"
---> Using cache
---> 8f26d34d9c0a
Step 3/5 : ENV DATA="data.csv"
---> Using cache
---> 16c83c16a4c8
Step 4/5 : WORKDIR /workspace
---> Running in fce8619af30b
Removing intermediate container fce8619af30b
---> a8278f609d9a
Step 5/5 : CMD R -q -e "source('$SCRIPT')"
---> Running in 765bafeb8681
Removing intermediate container 765bafeb8681
---> ff7d7b09dffb
Successfully built ff7d7b09dffb
Successfully tagged stackoverflow:latest
daniel@nuest /tmp/stackoverflow []$ docker run --rm -it -v $(pwd):/workspace stackoverflow
> source('script.R')
script.R
data.csv
>
>

另外,您可以尝试将数据路径作为参数传递给脚本文件,请参见 https://swcarpentry.github.io/r-novice-inflammation/05-cmdline/

顺便说一句:固定特定的R版本比使用 :latest更好,以提高可重复性。

关于r - 如何在Dockerfile中的多个CMD语句之间保留R工作区?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/62052919/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com