gpt4 book ai didi

python - 处理神经网络中未定义的数据

转载 作者:行者123 更新时间:2023-11-30 08:48:07 24 4
gpt4 key购买 nike

我正在做一个神经网络项目,其中有一个功能是从用户上次事件到某些特定时间所耗时。例如,假设有一个时间列表(3 月 15 日、4 月 1 日、4 月 24 日等),我们希望找到每个用户在任何这些特定时间之前的最后一次事件与特定时间之间的间隔。为了更清楚,图像user1如果在 3 月 10 日、3 月 13 日和 3 月 24 日有一些操作,则根据 3 月 15 日,他/她的值为 2 天(3 月 13 日)。现在,如果用户在 3 月 15 日之前没有任何操作怎么办?

现在由于某些算法,我加入了一些临时表,这导致有很多 NaN 。如何告诉网络不应该考虑这些小区?

<小时/>

编辑1

填充单元格的代码是这样的:

for aciton_time in all_aciton_times:
interval_tmp = actions_df.loc[(actions_df['when'] < aciton_time)].drop_duplicates(subset="device_id", keep='last')
interval_tmp['aciton_' + str(aciton_time)] = interval_tmp['when'].apply(lambda x: aciton_time - x)
del interval_tmp['when']
interval = interval.merge(interval_tmp, on="device_id", how="outer")
previous_aciton_time = aciton_time

结果是这样的:

screenshot

谢谢

最佳答案

如果您有一个大型数据集,您可以删除任何具有 NaN 值的行

关于python - 处理神经网络中未定义的数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57552853/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com