gpt4 book ai didi

python - Pandas:使用范围内的随机整数在 df 中创建新列

转载 作者:IT老高 更新时间:2023-10-28 20:34:16 24 4
gpt4 key购买 nike

我有一个 50k 行的 pandas 数据框。我正在尝试添加一个新列,它是从 1 到 5 的随机生成的整数。

如果我想要 50k 个随机数,我会使用:

df1['randNumCol'] = random.sample(xrange(50000), len(df1))

但为此我不知道该怎么做。

R 中的旁注,我会这样做:

sample(1:5, 50000, replace = TRUE)

有什么建议吗?

最佳答案

一种解决方案是使用 numpy.random.randint :

import numpy as np
df1['randNumCol'] = np.random.randint(1, 6, df1.shape[0])

或者如果数字不连续(尽管速度较慢),您可以使用这个:

df1['randNumCol'] = np.random.choice([1, 9, 20], df1.shape[0])

为了使结果可重现,您可以使用 numpy.random.seed 设置种子(例如 np.random.seed(42))

关于python - Pandas:使用范围内的随机整数在 df 中创建新列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30327417/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com