r - `weighted.mean` 在带有可选参数的函数中？-6ren

r - `weighted.mean` 在带有可选参数的函数中？

转载作者：行者123 更新时间：2023-12-02 19:09:20

28

4

我需要将 weighted.mean 函数包含在另一个函数中，作为我正在处理的项目的一部分。我无法让 w 参数在我正在处理的函数中正常工作。

为了使我的整体功能正常工作，我需要满足使权重参数必须是可选的。如果没有给出权重，我需要默认为某种wt = 1。使用条件语句可能很容易做到这一点，我在其中创建一个填充 1 的虚拟列，但我想知道这是否是最好的方法。

library(tidyverse)

my_weighted_mean <- function(var, wt) {
  var = enquo(var)
  
  mtcars %>%
    summarise_at(vars(!!var), ~weighted.mean(., w = wt))
  
}

## wrong output
my_weighted_mean(cyl, wt = "hp")
#>        cyl
#> 1 6.599231

## expected output
weighted.mean(mtcars$cyl, mtcars$hp)
#> [1] 6.860673

^{由reprex package于2020年10月27日创建(v0.3.0)}

最佳答案

最终更新
制作wt可选参数( wt = NULL )比我预期的更复杂。以下是使用 tryCatch 的方法。一旦我们知道是否 wt是 NULL我们可以将其替换为 1 向量与你的 data.frame 的长度。否则，我们可以将它与 curly-curly 运算符一起使用。根据OP的评论，新函数只需要一个参数x总结一个变量，多个分组变量可以放入省略号 ... .

library(dplyr)
library(rlang)

my_weighted_mean <- function(.dat, x, ..., wt = NULL) {
  
  .pred <- tryCatch(
    is.null(wt),
    error = function(e) {
      is.null(rlang::eval_tidy(enquo(wt), data = mtcars))
    })
  
  .dat %>% 
    group_by(...) %>% 
    summarise(
      {{x}} := weighted.mean({{x}},
                             w = if (.pred) rep(1, length({{x}})) else {{wt}} ))
  
}

mtcars %>% 
  my_weighted_mean(mpg)
#> # A tibble: 1 x 1
#>     mpg
#>   <dbl>
#> 1  20.1

mtcars %>% 
  my_weighted_mean(mpg, cyl)
#> `summarise()` ungrouping output (override with `.groups` argument)
#> # A tibble: 3 x 2
#>     cyl   mpg
#>   <dbl> <dbl>
#> 1     4  26.7
#> 2     6  19.7
#> 3     8  15.1

mtcars %>% 
  my_weighted_mean(mpg, cyl, wt = disp)
#> `summarise()` ungrouping output (override with `.groups` argument)
#> # A tibble: 3 x 2
#>     cyl   mpg
#>   <dbl> <dbl>
#> 1     4  25.8
#> 2     6  19.8
#> 3     8  14.9

mtcars %>% 
  my_weighted_mean(mpg, cyl, gear, wt = disp)
#> `summarise()` regrouping output by 'cyl' (override with `.groups` argument)
#> # A tibble: 8 x 3
#> # Groups:   cyl [3]
#>     cyl  gear   mpg
#>   <dbl> <dbl> <dbl>
#> 1     4     3  21.5
#> 2     4     4  25.9
#> 3     4     5  27.9
#> 4     6     3  19.9
#> 5     6     4  19.7
#> 6     6     5  19.7
#> 7     8     3  14.8
#> 8     8     5  15.4

^{由reprex package于2020年10月28日创建(v0.3.0)}

旧答案
您需要enqou() wt也可以或者只使用 curly-curly 运算符。如果您想将多个变量插入 var那么你可以使用省略号 ...而不是包裹在 curly-curly 中的变量名。

library(tidyverse)

my_weighted_mean <- function(var, wt) {
  
  mtcars %>%
    summarise_at(vars({{var}}), ~weighted.mean(., w = {{wt}}))
  
}

my_weighted_mean(cyl, wt = hp)
#>        cyl
#> 1 6.860673


my_weighted_mean <- function(..., wt) {

  mtcars %>%
    summarise_at(vars(...), ~weighted.mean(., w = {{wt}}))
  
}

my_weighted_mean(cyl, disp, wt = hp)
#>        cyl     disp
#> 1 6.860673 275.1096

^{由reprex package于2020年10月27日创建(v0.3.0)}

来自旧答案的更新(已更正) 正如@Konrad Rudolph 正确指出的那样，summarise_at已被取代，您不需要将其用于单个变量 - 此处 summarise足够。如果你想总结很多变量，新的官方方法是使用 across()如下:

my_weighted_mean <- function(..., wt) {
  
  mtcars %>%
    summarise(across(c(...),
                     ~weighted.mean(., w = {{wt}})))
  
}

my_weighted_mean(cyl, disp, wt = hp)

关于r - `weighted.mean` 在带有可选参数的函数中？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/64558827/

28

4

0

文章推荐： ios - SwiftUI:无缘无故在我的 View 上方填充？

文章推荐： c# - 当我将 json 字符串反序列化为 C# 对象时，类为空

文章推荐： kubernetes - Skaffold 开发人员因首次部署消息失败而挂起

recommendation-engine - LightFM : Weights and Sample Weights
我希望深入了解 LightFM 实现的以下权重: 样本权重什么是sample_weights在 fit方法？我读到它们是为了模拟时间衰减，但这究竟是如何工作的？解释这一点的示例或文章将非常有帮助。
netlogo - nw :weighted-path-to, nw:turtles-on-weighted-path-to 和多个同等加权的路径
如果这是一个愚蠢的问题，我预先道歉。当调用 nw:weighted-path-to 时，会返回一个链接列表，描述起始海龟和目标海龟之间的最短路径。类似地，调用 nw:turtles-on-weig
c - scanf ("%f", &weight) 和 scanf ("%f", Weight) 如何确定何时添加前缀 &
我阅读了以下代码: //talkback.c -- nosy, informative program #include #include //for strlen() prototype #d
html - font-weight 900 和 font-weight 700 的渲染方式相同
我有这个示例 html 文件: Test font bold (weight = 700) Test font bold (weight = 900) 我不知道为什么如果我将
python - 用户警告 : Discrepancy between trainable weights and collected trainable weights error
您好，我正在为我自己的数据集训练 VGG16 网络。下面给出了我使用的代码。 from keras.models import Sequential from scipy.misc import im
neural-network - 卷积神经网络中的 "Activations"、 "Activation Gradients"、 "Weights"和 "Weight Gradients"是什么？
我刚看完the notes CNN 上的斯坦福 CS231n 和现场链接 demo ;然而，我不确定演示中的“激活”、“激活梯度”、“权重”和“权重梯度”指的是什么。以下屏幕截图已从演示中复制。混
machine-learning - 最大输出神经元 : are the weights in the maxout function referring to 2 unique sets of weights?
我不明白 maxout 是如何工作的，我怀疑这是由于我对线性代数乘法的可视化造成的。基本上，我的印象是 maxout 函数有两组权重，均经过单独训练，然后只选择一组。但我怀疑这可能是错误的，因为我没有
python - 值错误 : Attempt to have a second RNNCell use the weights of a variable scope that already has weights
我运行了 Tensorflow 1.0 提供的 ptb_word_lm.py，但它显示了这条消息: ValueError: Attempt to have a second RNNCell use t
R 样本概率 : Default is equal weight; why does specifying equal weights cause different values to be returned?
我有一个关于 R 中的样本函数的简单问题。我从长度为 5 的输入向量中随机抽样 0 和 1 并将它们相加，该向量指定要运行的试验次数并设置种子以生成可重复的随机数字。种子按预期工作，但根据我在 pro
python - ValueError : You called `set_weights(weights)` on optimizer RMSprop with a weight list of length 3, 但优化器期望权重为 0
我有一个以“h5”格式保存的模型。在使用编译模型后，我正在尝试恢复训练并尝试加载优化器的权重 model.optimizer.set_weights(weights_list) 哪里weights_
python - 在状态字典 : 0. 0.weight"、 "0.1.weight"、 "0.1.bias"、 "0.1.running_mean"中遇到缺少 key
我正在尝试为我的大学项目开发电话分类器模型。我已经训练了我的模型，当我尝试通过执行 python app/server.pyserve 来部署模型时遇到了问题。我读了一篇文章( https://f
javascript - 数组和对象变量的存储和 'weight'
所以... var testArray=new Array("hello"); testArray.length=100; console.log(testArray.length); 我相信上面的内
CSS 规范 : what has more "weight"
在 css 规范中，什么会影响更多的 inline 样式或外部 !important 外部“style.css”: #di{color: green!important;} div 文本颜色是红色还
javascript - D3力导向图节点没有属性 "weight"
我正在使用 http://hughsk.github.io/colony/ 的调整后的代码，但我不断收到错误: Uncaught TypeError: Cannot read property 'we
SQL 按 "weight"对记录进行排序
我们有一个系统，它按表中的“优先级”编号处理记录。我们通过表的内容定义优先级，例如 UPDATE table SET priority=3 WHERE processed IS NULL UPDATE
tensorflow - 将生成的检查点转换为 .weights darkflow
我已经使用 Darkflow 和 yolov2.weights 进行了定制训练。 checkpoint 文件夹中有四个文件。它们是: 1.yolov2-3c-5500.data-00000-of-00
r - `weighted.mean` 在带有可选参数的函数中？
我需要将 weighted.mean 函数包含在另一个函数中，作为我正在处理的项目的一部分。我无法让 w 参数在我正在处理的函数中正常工作。为了使我的整体功能正常工作，我需要满足使权重参数必须是可选
R ggplot : Weighted CDF
我想使用 ggplot 绘制加权 CDF。一些旧的非 SO 讨论(例如 2012 年的 this)表明这是不可能的，但我想我会重新加注。例如，考虑以下数据: df <- data.frame(x=s
java - 计算对象的 'weight'，howto
这个问题已经有答案了: 已关闭11 年前。 Possible Duplicate: In Java, what is the best way to determine the size of an
r - `weighted.mean` 在带有可选参数的函数中？
我需要将 weighted.mean 函数包含在另一个函数中，作为我正在处理的项目的一部分。我无法让 w 参数在我正在处理的函数中正常工作。为了使我的整体功能正常工作，我需要满足使权重参数必须是可选

首页

博学

6Ren·AI

商城

r - `weighted.mean` 在带有可选参数的函数中？