gpt4 book ai didi

python - 如何每周从 pandas 数据框中提取唯一值

转载 作者:太空宇宙 更新时间:2023-11-03 15:49:35 25 4
gpt4 key购买 nike

我有一个 pandas 数据框,如下所示,我需要每周从中提取所有唯一的用户 ID:-

    sender_user_id    created
0 2 2016-12-19 03:34:30.013923
1 3 2016-12-20 03:34:30.013923
2 6 2016-12-21 03:34:30.013923
3 22 2016-12-22 03:34:30.013923
3 6 2016-12-22 06:34:30.013923

我需要一个输出字典或数据框,它每周聚合所有唯一的 user_id,如下所示

    created                         user_ids
0 2016-12-19 03:34:30.013923 2,5,24,15,6
1 2016-12-25 03:34:30.013923 8,9,14,21,5

我有一个想法,我们可以每周拆分数据帧并使用
numpy.unique() 函数,但是有没有一个好的且优化的方法来做到这一点?

最佳答案

考虑这个随机生成的df

rng = np.arange(100)
df = pd.DataFrame(columns=['sender_user_id', 'created'])
for t in pd.date_range('2016-03-31', periods=10, freq='3B'):
for i in np.random.permutation(rng)[:5]:
df = df.append(dict(sender_user_id=i, created=t), ignore_index=True)

df.sender_user_id = df.sender_user_id.astype(int)

重新采样on

df.resample('W', on='created').sender_user_id.unique().reset_index(name='user_ids')

enter image description here

关于python - 如何每周从 pandas 数据框中提取唯一值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41430529/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com