gpt4 book ai didi

python - 通过与训练数据的一致映射来分解实时数据?

转载 作者:行者123 更新时间:2023-11-30 08:48:39 25 4
gpt4 key购买 nike

在生产层面,我想使用预先保存的模型来预测我的实时数据。

但是,我不知道在分解分类数据时如何设置实时数据以与训练数据保持一致的映射。

From this article我知道我可以将训练数据和新数据堆叠在一起并使它们保持一致。

但是,堆叠并完成整个过程(进行整个特征工程、训练和预测)太耗时了。

  • 整个过程:15 分钟v.s.模型。仅预测:3 秒

由于生产级系统对时间敏感,我可以使用任何方法来分解新数据以使其具有与训练数据相同的映射吗?

或者我只能通过“手动”来完成,例如

 df.loc[df['col_name']=='YES', 'col_name'] =  '1'

这可能会导致很长的编码?

最佳答案

如果您的意思是考虑新的分类值(例如,您获得 df.color 的新值“蓝绿”),则可以将任何意外值弹回同一个 -1 存储桶(假设是未知的),然后在后处理中或在重新调整模型时处理该问题。

本质上,您可以捕获类别异常,然后稍后处理它们。

关于python - 通过与训练数据的一致映射来分解实时数据?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51943037/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com