gpt4 book ai didi

r - 使用微基准评估多行代码块

转载 作者:行者123 更新时间:2023-12-03 16:05:05 25 4
gpt4 key购买 nike

是否可以使用微基准评估由多行代码组成的代码块?如果是这样,怎么做?

例子:
我们在字符列中有一些数字数据:

testdata <- tibble::tibble(col1 = runif(1000), col2 = as.character(runif(1000)), col3 = as.character(runif(1000)))

现在我们可以尝试不同的方式来转换这些。
我们可以直接在列上调用 as.numeric :
testdata$col2 <- as.numeric(testdata$col2)
testdata$col3 <- as.numeric(testdata$col3)

我们可以尝试在 dplyr 中执行此操作变异:
testdata <- dplyr::mutate(testdata, col2 = as.numeric(col2),
col3 = as.numeric(col3))

或者也许我们知道所有列都应该是数字的,所以我们可以尝试一些不太明确的东西来做一些检查:
testdata <- dplyr::mutate_if(testdata, .predicate = is.character, .funs = as.numeric)

现在我们要比较这 3 个选项的性能。

后两个选项是单独的调用,因此可以很容易地在微基准测试中进行测试,但第一个选项由两个单独的调用组成。我们可以将这两个调用包装在一个函数中,然后在 microbenchmark 中对其进行评估,但这会引入函数的轻微开销,因此在技术上并不能评估我们现在拥有的解决方案。我们可以将调用分别包含在微基准测试中,然后将它们相加,因为平均值应该没问题,但是对于最小值或最大值之类的东西,这不一定会给出合理的结果。

microbenchmark 文档中的示例大多使用简单的单个表达式,并且经常使用简单的函数来包装代码。

是否可以直接将多行代码输入到 microbenchmark 中一起评估?

最佳答案

通过在 {} 中包装多行代码并用 ; 分隔它们它们可以在微基准测试中作为一个 block 进行评估

bench <- microbenchmark(separate = {as.numeric(testdata$col2); as.numeric(testdata$col3)},
mutate = dplyr::mutate(testdata, col2 = as.numeric(col2),
col3 = as.numeric(col3)),
mutateif = dplyr::mutate_if(testdata, .predicate = is.character, .funs = as.numeric))

这给出了以下结果:
> bench
Unit: microseconds
expr min lq mean median uq max neval
separate 477.014 529.708 594.8982 576.4275 611.6275 1109.762 100
mutate 3410.351 3633.070 4465.0583 3876.6975 4446.0845 34298.910 100
mutateif 5118.725 5365.126 7241.5727 5637.5520 6290.7795 118874.982 100

关于r - 使用微基准评估多行代码块,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47993055/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com