gpt4 book ai didi

pandas - 如何使用 pandas 从数据集中随机选择行?

转载 作者:行者123 更新时间:2023-12-02 20:41:30 25 4
gpt4 key购买 nike

我有一个包含 36k 行的数据集。我想使用 pandas 从中随机选择 9k 行。我该如何完成这个任务?

最佳答案

我认为你可以使用sample - 9k25% 行:

df.sample(n=9000)

或者:

df.sample(frac=0.25)

另一种解决方案,通过numpy.random.choice创建索引的随机样本然后通过 loc 选择 - index 必须是唯一的:

df = df.loc[np.random.choice(df.index, size=9000)]

如果不是唯一索引的解决方案:

df = df.iloc[np.random.choice(np.arange(len(df)), size=9000)]

关于pandas - 如何使用 pandas 从数据集中随机选择行?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43062613/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com