gpt4 book ai didi

R:如何编写函数以从数据帧中提取特定值以便输入另一个数据帧

转载 作者:行者123 更新时间:2023-12-04 15:16:00 24 4
gpt4 key购买 nike

我有一个数据框,其中包含每个水果类别的一些参数的下限和上限。它看起来像这样:

+----------+-----------+-------+-------+
| Category | Parameter | Upper | Lower |
+----------+-----------+-------+-------+
| Apple | alpha | 10 | 20 |
+----------+-----------+-------+-------+
| Apple | beta | 20 | 30 |
+----------+-----------+-------+-------+
| Orange | alpha | 10 | 20 |
+----------+-----------+-------+-------+
| Orange | beta | 30 | 40 |
+----------+-----------+-------+-------+
| Orange | gamma | 50 | 60 |
+----------+-----------+-------+-------+
| Pear | alpha | 10 | 30 |
+----------+-----------+-------+-------+
| Pear | beta | 20 | 40 |
+----------+-----------+-------+-------+
| Pear | gamma | 20 | 30 |
+----------+-----------+-------+-------+
| Banana | alpha | 40 | 50 |
+----------+-----------+-------+-------+
| Banana | beta | 20 | 40 |
+----------+-----------+-------+-------+

我想写一个函数:

  • 输入1个水果名称function("Apple")
  • 提取该水果所有参数的上限值和下限值
  • 将所选水果的 alpha、beta 和 gamma(如果适用)的上限和下限输入以下过程以生成一个数据框:
param_grid_[fruit_name] <- expand.grid(alpha = seq(lower, upper, length.out = 100),
beta = seq(lower, upper, length.out = 100),
gamma = seq(lower, upper, length.out = 100))
  • 仅当水果在原始表中有gamma参数时才适用gamma

例如,如果我对函数的输入是“Apple”,那么我最终应该有:

param_grid_Apple <- expand.grid(alpha = seq(10, 20, length.out = 100),
beta = seq(20, 30, length.out = 100))

例如,如果我对函数的输入是“Pear”,那么我最终应该有:

param_grid_Pear <- expand.grid(alpha = seq(10, 30, length.out = 100),
beta = seq(20, 40, length.out = 100),
gamma = seq(20, 30, length.out = 100))

我试过直接对行和列索引进行子集化。例如,对于 Apple 的上层 alpha,我会做 df[2,3]。但这是一种相当手动且简单的方法。 我想知道我是否可以将所有内容包装在一个函数中以简化此过程。

仍然是 R 的初学者,正在尝试学习通过编写函数来简化程序的方法。非常感谢您的帮助!


附言(仅供引用 - 可能与这篇文章的中心问题没有直接关系)我这样做是为了将 param_grid 馈送到 nls2 函数中以拟合每个水果的曲线:

nls2(formula = ...,
data = ...,
start = param_grid,
algorithm = "brute-force",
control = nls.control(maxiter = 1e4))

最佳答案

这是考虑使用 purrr 包的另一种方法。

您可以创建一个函数并将您的数据框、水果名称和所需的序列长度传递给它。

您可以过滤 与您的水果对应的行,然后使用map2 获取每个参数的序列。 cross_df 相当于 expand.grid 并且会返回一个数据框。

library(purrr)

param_grid <- function(df, fruit, length) {
df_fruit <- df %>%
filter(Category == fruit)

map2(df_fruit$Upper, df_fruit$Lower, seq, length.out = length) %>%
set_names(df_fruit$Parameter) %>%
cross_df()
}

param_grid(df, "Apple", 100)

输出

# A tibble: 1,000,000 x 3
alpha beta gamma
<dbl> <dbl> <dbl>
1 10 20 20
2 10.2 20 20
3 10.4 20 20
4 10.6 20 20
5 10.8 20 20
6 11.0 20 20
7 11.2 20 20
8 11.4 20 20
9 11.6 20 20
10 11.8 20 20
# … with 999,990 more rows

关于R:如何编写函数以从数据帧中提取特定值以便输入另一个数据帧,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/64320084/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com