gpt4 book ai didi

python - 将转换从 `pandas.get_dummies` 应用到新数据的简单方法?

转载 作者:IT老高 更新时间:2023-10-28 20:54:08 25 4
gpt4 key购买 nike

假设我有一个数据框 data,其中包含要转换为指标的字符串。我使用 pandas.get_dummies(data) 将其转换为我现在可以用于构建模型的数据集。

现在我有一个新的观察结果,我想在我的模型中运行。显然我不能使用 pandas.get_dummies(new_data) 因为它不包含所有类并且不会制作相同的指标矩阵。有什么好办法吗?

最佳答案

您可以从单个新观察中创建虚拟对象,然后使用原始指标矩阵中的列重新索引此框架列:

import pandas as pd
df = pd.DataFrame({'cat':['a','b','c','d'],'val':[1,2,5,10]})
df1 = pd.get_dummies(pd.DataFrame({'cat':['a'],'val':[1]}))
dummies_frame = pd.get_dummies(df)
df1.reindex(columns = dummies_frame.columns, fill_value=0)

返回:

        val     cat_a   cat_b   cat_c   cat_d
0 1 1 0 0 0

关于python - 将转换从 `pandas.get_dummies` 应用到新数据的简单方法?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28465633/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com