gpt4 book ai didi

python - 在时间序列数据集中使随机值为零

转载 作者:行者123 更新时间:2023-12-04 07:52:08 26 4
gpt4 key购买 nike

我有一个时间序列数据集,其中包含特定日期的日期和销售额。我想随机(如果可能的话,也是连续几天的序列)销售值 0 来检查不同的模型如何对缺失的销售值使用react。做到这一点的最佳方法是什么?提前致谢!

最佳答案

您可以使用随机整数生成器来获取预定义数量的索引,并使用它将数据帧的这些行设置为零

import pandas as pd
import numpy as np
from numpy.random import default_rng

df = pd.DataFrame({'date': pd.date_range(pd.Timestamp(2021,1,1,), freq='D', periods=10),
'sales': np.random.randint(1, 100, 10)})
df


date sales
0 2021-01-01 5
1 2021-01-02 88
2 2021-01-03 8
3 2021-01-04 35
4 2021-01-05 45
5 2021-01-06 24
6 2021-01-07 66
7 2021-01-08 1
8 2021-01-09 10
9 2021-01-10 85

rng = default_rng()
zero_idx = rng.choice(len(df.index), size=5, replace=False)
zero_idx

array([6, 5, 0, 7, 1], dtype=int64)

df.loc[zero_idx,'sales'] = 0
df

date sales
0 2021-01-01 0
1 2021-01-02 0
2 2021-01-03 8
3 2021-01-04 35
4 2021-01-05 45
5 2021-01-06 0
6 2021-01-07 0
7 2021-01-08 0
8 2021-01-09 10
9 2021-01-10 85

关于python - 在时间序列数据集中使随机值为零,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/66903174/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com