作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在做一个神经网络项目,其中有一个功能是从用户上次事件到某些特定时间所耗时。例如,假设有一个时间列表(3 月 15 日、4 月 1 日、4 月 24 日等),我们希望找到每个用户在任何这些特定时间之前的最后一次事件与特定时间之间的间隔。为了更清楚,图像user1
如果在 3 月 10 日、3 月 13 日和 3 月 24 日有一些操作,则根据 3 月 15 日,他/她的值为 2 天(3 月 13 日)。现在,如果用户在 3 月 15 日之前没有任何操作怎么办?
现在由于某些算法,我加入了一些临时表,这导致有很多 NaN
。如何告诉网络不应该考虑这些小区?
编辑1
填充单元格的代码是这样的:
for aciton_time in all_aciton_times:
interval_tmp = actions_df.loc[(actions_df['when'] < aciton_time)].drop_duplicates(subset="device_id", keep='last')
interval_tmp['aciton_' + str(aciton_time)] = interval_tmp['when'].apply(lambda x: aciton_time - x)
del interval_tmp['when']
interval = interval.merge(interval_tmp, on="device_id", how="outer")
previous_aciton_time = aciton_time
结果是这样的:
谢谢
最佳答案
如果您有一个大型数据集,您可以删除任何具有 NaN 值的行
关于python - 处理神经网络中未定义的数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57552853/
我是一名优秀的程序员,十分优秀!