gpt4 book ai didi

featuretools:如何为回归任务正确生成特征

转载 作者:行者123 更新时间:2023-12-02 20:27:10 25 4
gpt4 key购买 nike

我想尝试 featuretools,但我需要提示,如何将其用于我的数据集。我在 pandas 数据框中有数据,这是一个回归问题。

这是我的数据集的示例: enter image description here

我尝试了什么:

import featuretools as ft
es = ft.EntitySet(id = 'train_X')
es = es.entity_from_dataframe(entity_id="train_X",
dataframe=X,
index="Index",
variable_types={
"Market": ft.variable_types.Categorical,
"Stock": ft.variable_types.Categorical,}
)

feature_matrix_customers, features_defs = ft.dfs(entities=es,
target_entity="y")

出现错误:

 KeyError: 'Entity 0 does not exist in train_X').

最佳答案

这里的问题可能是您尝试直接使用 pandas 数据帧作为输入,而不是将数据加载到 EntitySet 中。您应该创建一个 EntitySet并为此构建功能。您还可以将 EntitySet.enormalize_entity(...) 与该 EntitySet 一起使用来创建其他实体以辅助特征工程。

请注意:您可能需要研究一下使用 cutoff_times使用此数据类型,这将允许您指定哪些数据可以和不能用于生成特征。

关于featuretools:如何为回归任务正确生成特征,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49607014/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com