gpt4 book ai didi

python - 特征工程的建议

转载 作者:行者123 更新时间:2023-11-30 08:48:22 25 4
gpt4 key购买 nike

我在功能工程期间遇到问题。寻找一些建议。问题陈述:我有多个客户3天的使用数据。有些仅使用 1 天,有些使用 2 天,有些使用 3 天。数据与每天发送的电子邮件数量/添加的联系人数量等相关。

我正在将此时间序列数据转换为按列,即客户在第 1 天发送的电子邮件数量作为一项功能,客户在第 2 天发送的电子邮件数量作为一项功能,依此类推。但问题是,对于不同的客户,使用方式可以是递增顺序,也可以是递减顺序。

即,示例 1:客户 'A' --> '1 日发送的电子邮件数。天' = 100 。 '第二天发送的电子邮件数量'=0

示例 2:客户 'B' --> '1 日发送的电子邮件数。天' = 0 。 '第二天发送的电子邮件数量'=100

示例 3:客户“C”-->“1 日发送的电子邮件数”。天' = 0 。 '第二天发送的电子邮件数量'=0

示例 4:客户 'D' --> '1 日发送的电子邮件数。天' = 100 。 '第二天发送的电子邮件数量'=100

在前两种情况下 => 我的新功能将使用“-100”和“100”作为值。我认为这有利于区分。但是当新特征值在两种情况下都为“0”时,第三列和第四列就会出现问题谁能建议一种方法来处理这个问题

最佳答案

您可以提取以下特征:

    分别用于第 2 天和第 3 天的
  1. 简单移动平均线。这意味着您现在有两列额外的列。

  2. 较前一天的百分比变化

  3. 第 1 天到第 3 天的百分比变化

关于python - 特征工程的建议,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55623095/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com