gpt4 book ai didi

python - 如何随机追加 "Yes/No"(比例为7 :3) to a column in pandas dataframe?

转载 作者:太空宇宙 更新时间:2023-11-03 12:31:44 24 4
gpt4 key购买 nike

我有一个数据框,它由三列组成。我想使用 python-pandas 将"is"或“否”附加到其中一个列。是与否的比例也是 7:3。

有人试过吗?

最佳答案

使用 numpy 的 random.choice :

df["new_column"] = np.random.choice(["Yes", "No"], len(df), p=[0.7, 0.3])

注意:np.random.choice 由独立试验组成(除非您通过 replace = False)。在每次试验中,获得"is"的概率为 0.7。最后,您可能不会恰好达到 70% 的比率。但是,对于 2480500 行,此二项式​​分布将近似于均值 2480500 * 0.7 和标准差 sqrt(2480500 * 0.7 * 0.3) 的正态分布。使用 +/-3 标准偏差(概率为 99.73%),您最终将得到 (0.69913, 0.70087) 之间的比率。但是如果你想要恰好 70%,你可以使用 pandas 的样本作为 @EdChum suggested。 ,我想它有一个校正因子。

关于python - 如何随机追加 "Yes/No"(比例为7 :3) to a column in pandas dataframe?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37331127/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com