r - 当有一个角色作为 ID 的变量时，为什么部署带有香根草的 tidymodel 会抛出错误？-6ren

r - 当有一个角色作为 ID 的变量时，为什么部署带有香根草的 tidymodel 会抛出错误？

转载作者：行者123 更新时间：2023-12-05 04:33:30

25

4

我无法部署带有香根草的 tidymodel，并且无法在模型包含一个变量并将角色作为配方中的 ID 时得到预测。请参阅图像中的以下错误:

{"error": "500 - 内部服务器错误",“消息”:“错误:缺少以下必需的列:'Fake_ID'。\n”

虚拟示例的代码如下。我是否需要从模型和配方中删除 ID 变量才能使 Plumber API 正常工作？

#Load libraries
library(recipes)
library(parsnip)
library(workflows)
library(pins)
library(plumber)
library(stringi)



#Upload data
data(Sacramento, package = "modeldata")


#Create fake IDs for testing
Sacramento$Fake_ID <- stri_rand_strings(nrow(Sacramento), 10)


# Train model
Sacramento_recipe <- recipe(formula = price ~ type + sqft + beds + baths + zip + Fake_ID, data = Sacramento) %>% 
  update_role(Fake_ID, new_role = "ID") %>% 
  step_zv(all_predictors())

rf_spec <- rand_forest(mode = "regression") %>% set_engine("ranger")

rf_fit <-
  workflow() %>%
  add_model(rf_spec) %>%
  add_recipe(Sacramento_recipe) %>%
  fit(Sacramento)


# Create vetiver object
v <- vetiver::vetiver_model(rf_fit, "sacramento_rf")
v


# Allow for model versioning and sharing
model_board <- board_temp()
model_board %>% vetiver_pin_write(v)


# Deploying model
pr() %>%
  vetiver_api(v) %>%
  pr_run(port = 8088)

Running the example of the Plumber API

最佳答案

截至今天，香根草寻找“霉菌”workflows::extract_mold(rf_fit) 并且仅获取预测变量以创建 ptype。但是当您从工作流中进行预测时，它确实需要所有变量，包括非预测变量。如果您已经使用非预测器训练了模型，那么从今天开始，您可以通过传入自定义 ptype 来使 API 工作:

library(recipes)
#> Loading required package: dplyr
#> 
#> Attaching package: 'dplyr'
#> The following objects are masked from 'package:stats':
#> 
#>     filter, lag
#> The following objects are masked from 'package:base':
#> 
#>     intersect, setdiff, setequal, union
#> 
#> Attaching package: 'recipes'
#> The following object is masked from 'package:stats':
#> 
#>     step
library(parsnip)
library(workflows)
library(pins)
library(plumber)
library(stringi)

data(Sacramento, package = "modeldata")
Sacramento$Fake_ID <- stri_rand_strings(nrow(Sacramento), 10)


Sacramento_recipe <- 
    recipe(formula = price ~ type + sqft + beds + baths + zip + Fake_ID, 
           data = Sacramento) %>% 
    update_role(Fake_ID, new_role = "ID") %>% 
    step_zv(all_predictors())

rf_spec <- rand_forest(mode = "regression") %>% set_engine("ranger")

rf_fit <-
    workflow() %>%
    add_model(rf_spec) %>%
    add_recipe(Sacramento_recipe) %>%
    fit(Sacramento)


library(vetiver)
## this is probably easiest because this model uses a simple formula
## if there is more complex preprocessing, select the variables
## from `Sacramento` via dplyr or similar
sac_ptype <- extract_recipe(rf_fit) %>% 
    bake(new_data = Sacramento, -all_outcomes()) %>% 
    vctrs::vec_ptype()

v <- vetiver_model(rf_fit, "sacramento_rf", save_ptype = sac_ptype)
v
#> 
#> ── sacramento_rf ─ <butchered_workflow> model for deployment 
#> A ranger regression modeling workflow using 6 features

pr() %>%
    vetiver_api(v)
#> # Plumber router with 2 endpoints, 4 filters, and 0 sub-routers.
#> # Use `pr_run()` on this object to start the API.
#> ├──[queryString]
#> ├──[body]
#> ├──[cookieParser]
#> ├──[sharedSecret]
#> ├──/ping (GET)
#> └──/predict (POST)

^{由 reprex package 创建于 2022-03-10 (v2.0.1)}

您是否正在使用非预测变量训练生产模型？你介意吗opening an issue on GitHub多解释一下您的用例？

关于r - 当有一个角色作为 ID 的变量时，为什么部署带有香根草的 tidymodel 会抛出错误？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/71397075/

25

4

0

文章推荐： c - 在编译时构建静态数组

文章推荐： javascript - React Native，动态显示图像

postgresql - 通过 jenkins 部署 postgres - 持续集成/部署
我在 *.sql 文件中得到了我的数据库转储(表、函数、触发器等)。此时我正在通过 jenkins 部署它们，通过传递执行 shell 命令: sudo -u postgres psql -d my_
api - Web 部署 API(部署 .zip 包)说明
我正在使用网络部署 API 来部署网络包(.zip 文件，由 MSDeploy.exe 创建)以编程方式将包发布到服务器(在发布包之前我们需要做一些其他事情这就是为什么我们不使用 MSDeploy.e
c# - Web 部署 API - 部署 .NET 4.5 应用程序
我们正在使用 Web Deploy 3 的(几乎完全未记录的)“公共(public) API”来创建我们网站的 .zip 包，然后将其同步到服务器: DeploymentBaseOptions des
Clojure 部署？
将 clojure 应用程序制作成可执行文件的最简单方法是什么，例如 http://rawr.rubyforge.org/ ruby 吗？ (exe 和 app 文件也是) 最佳答案使用 leini
Android内核编译/部署
是否可以下载 Android 源代码并针对任何设备进行编译？我想做的是尝试 GSM 代码部分并编译操作系统并将其部署到我的摩托罗拉手机上。谢谢! 最佳答案是的，但这很难，因为大多数手机不共享驱动
c++ - 部署
我正在考虑用 c/c++ 编写需要在大多数个人计算机上运行的 nbody 样式模拟。本质上是一个 O(n^2) 粒子模拟器。因为这需要相当用户友好，所以我希望有 1 个不需要用户安装任何东西的 Wi
Kubernetes 部署 - 状态副本和规范副本之间的区别
需要了解 kubernetes 部署中 kube_deployment_status_replicas 和 kube_deployment_spec_replicas 指标的区别最佳答案简而言之，
Maven 部署 + 源分类器
我正在尝试使用分类器部署 Maven Artifact 。由于我需要源代码和 JAR(我从 GWT 使用它)，我想获得 artifact-version-classifier.jar 和 artifa
PhpStorm 部署 - 每次都要求提供登录凭据
我设置部署以将我的项目代码与存储我的网站的 FTP 服务器上的项目同步。但是，每次尝试同步时，我总是必须登录。我什至检查了记住，但它不起作用! 我正在使用最新的 PhpStorm 2017.1.4
ASP.NET 部署
我在 Visual Studio 2008 中开发了一个 ASP.NET 网站。现在我想在其他机器上部署它。我怎样才能做到这一点？？就像我们为 Windows 应用程序制作安装包一样，我们可以为 AS
Qt Mac 部署
将 QT 框架添加到我的 .app 包中我正在关注 Qt 站点上关于部署的文档。我创建了一个名为 HTTPClient.app 的应用程序我在 Contents 下创建了 Framework 文
eclipse - JavaMe 部署
这个问题不太可能对任何 future 的访客有帮助；它只与一个小的地理区域、一个特定的时间点或一个非常狭窄的情况相关，通常不适用于互联网的全局受众。如需帮助使这个问题更广泛适用，visit the h
部署 CMS 驱动的内容
我正在研究改变我目前创建营销网站的策略。目前，我完全用 PHP 从头开始构建网站，使用一个简单的包含系统。所有代码(以及内容)都存储在文件(而不是数据库)中，允许我使用 Subversion 进行
没有端口的 Kubernetes 部署
我有一个长期运行的服务(在 while 1 循环中)并通过 GCloud pub/sub 处理有效负载，之后它将结果写入数据库。该服务不需要监听任何端口。 Kind=Deployment 的声明性
kubernetes - 如何诊断停滞的Kubernetes部署/部署？
似乎部署已停滞不前。我该如何进一步诊断？ kubectl rollout status deployment/wordpress Waiting for rollout to finish: 2 ou
dart - AngularDart转换/部署
我正在Dart中使用前端的Angular和后端的Shelf构建一个客户端/服务器应用程序。当我执行pub build时，它会按预期生成Dart文件的javascript，但不会替换HTML文件中的Da
Azure 部署 - 授权后无法查看所有存储库
我在 Azure 部署中心的下拉列表中看不到我的所有 Github 组织存储库。 Azure 很久以前就已经被授权了，下拉列表正确地显示了所有的存储库，直到上周我在 DevOps 中玩游戏时，不得不再
部署: Most secure,最优雅的方式来获取登录用户创建的特定集合中的所有对象？
我认为标题几乎说明了一切...对于 Deployd 来说是全新的，所以任何关于如何最好地实现这一点的指示都值得赞赏。最佳答案要获取用户创建的集合中的对象(我假设您使用的是 javascript 库
bash - 使用Bash脚本进行Docker构建/部署
我有一个试图用于CD服务器的部署脚本，但是在编写bash脚本以完成一些所需的步骤(例如运行npm和迁移命令)时遇到了问题。我将如何从该脚本进入容器bash，运行下面的命令，然后退出以完成对更改的提取
Kubernetes 部署 - 传递参数
我想在使用 kubectl 时将参数传递给 Kubernetes 部署命令应用部署文件。示例:在我的部署 .yaml 中，我有如下参数，我想在使用 kubectl apply - f .yaml 运

首页

博学

6Ren·AI

商城

r - 当有一个角色作为 ID 的变量时，为什么部署带有香根草的 tidymodel 会抛出错误？