gpt4 book ai didi

r - 如何使用 knitr 缓存结果来重现给定 block 中的环境?

转载 作者:行者123 更新时间:2023-12-03 11:43:16 25 4
gpt4 key购买 nike

tl;博士

我的问题:在 R session 中,有什么方法可以使用 针织 的缓存结果“快进”到给定代码块中可用的环境(即对象集),与 knit() 相同。本身呢?

设置:

针织 的内置缓存代码块是其杀手级功能之一。

当某些 block 包含耗时的计算时,它特别有用。除非它们(或它们所依赖的 block )被更改,否则只需要在文档第一次为 knit 时执行计算。 ed:在所有后续调用 knit 时, block 创建的对象只会从缓存中加载。

这是一个最小的示例,一个名为 "lotsOfComps.Rnw" 的文件:

\documentclass{article}
\begin{document}

The calculations in this chunk take a looooong time.

<<slowChunk, cache=TRUE>>=
Sys.sleep(30) ## Stands in for some time-consuming computation
x <- sample(1:10, size=2)
@

I wish I could `fast-forward' to this chunk, to view the cached value of
\texttt{x}

<<interestingChunk>>=
y <- prod(x)^2
y
@

\end{document}

编织和 TeXify 所需的时间 "lotsOfComps.Rnw" :
## First time
system.time(knit2pdf("lotsOfComps.Rnw"))
## user system elapsed
## 0.07 0.02 31.81

## Second (and subsequent) runs
system.time(knit2pdf("lotsOfComps.Rnw"))
## user system elapsed
## 0.03 0.02 1.28

我的问题:

在 R session 中,有什么方法可以使用 针织 的缓存结果“快进”到给定代码块中可用的环境(即对象集),与 knit() 相同。本身呢?

purl("lotsOfComps.Rnw")然后运行 ​​ "lotsOfComps.R" 中的代码不起作用,因为必须重新计算沿途的所有对象。

理想情况下,可以做这样的事情以结束在 <<interestingChunk>>= 开头存在的环境中。 :
spin("lotsOfComps.Rnw", chunk="interestingChunk")
ls()
# [1] "x"
x
# [1] 3 8

由于 spin() (还没有?)可用,获得等效结果的最佳方法是什么?

最佳答案

这是一个解决方案,它仍然有点尴尬,但它有效。这个想法是添加一个名为 mute 的 block 选项。需要NULL默认情况下,但它也可以采用 R 表达式,例如mute_later()以下。当knitr评估 block 选项,mute_later()可以评估和NULL被退回;同时,opts_chunk 中还有副作用(设置全局 block 选项,如 eval = FALSE )。

现在你需要做的是把 mute=mute_later()在您想要跳过其余 block 的 block 中,例如您可以从 example-a 中移动此选项至example-b .因为mute_later()返回 NULL这恰好是 mute 的默认值选项,即使您移动此选项,缓存也不会被破坏。

\documentclass{article}
\begin{document}

<<setup, include=FALSE, cache=FALSE>>=
rm(list = ls(all.names = TRUE), envir = globalenv())
opts_chunk$set(cache = TRUE) # enable cache to make it faster
opts_chunk$set(eval = TRUE, echo = TRUE, include = TRUE)

# set global options to mute later chunks
mute_later = function() {
opts_chunk$set(cache = FALSE, eval = FALSE, echo = FALSE, include = FALSE)
NULL
}
# a global option mute=NULL so that using mute_later() will not break cache
opts_chunk$set(mute = NULL)
@

<<example-a, mute=mute_later()>>=
x = rnorm(4)
Sys.sleep(5)
@

<<example-b>>=
y = rpois(10,5)
Sys.sleep(5)
@

<<example-c>>=
z = 1:10
Sys.sleep(3)
@

\end{document}

从某种意义上说,您必须剪切和粘贴 , mute=mute_later(),这很尴尬大约。理想情况下,您应该像我为 Barry 写的要点一样设置 block 标签。

我原来的要点不起作用的原因是因为在缓存 block 时忽略了 block Hook 。第二次你 knit()文件, block Hook checkpoint对于 example-a被跳过,因此 eval=TRUE对于其余的 block ,你看到所有的 block 都被评估了。相比之下, block 选项总是动态评估的。

关于r - 如何使用 knitr 缓存结果来重现给定 block 中的环境?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15708269/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com