gpt4 book ai didi

python - 根据列值从数据框中随机选择行

转载 作者:行者123 更新时间:2023-12-05 00:42:09 24 4
gpt4 key购买 nike

我有一个 Pandas 数据框如下:

col1, col2, label
a b 0
b b , 0
.
.
.......... 0
.......... 1

以及标签列的value_counts:

df['label'].value_counts():

0: 200000
1: 10000

我想从标签中随机选择值为“0”的 50000 行,这样我的 value_counts 变为:

0: 50000
1: 10000

最佳答案

过滤每个值和 sample N每个人的值(value)观。然后,获取他们的索引,通过union加入只是loc

s0 = df.label[df.label.eq(0)].sample(50000).index
s1 = df.label[df.label.eq(1)].sample(10000).index

df = df.loc[s0.union(s1)]

当然,您不需要指定 10000s1如果你只是得到所有这些:) 它只是为了说明

关于python - 根据列值从数据框中随机选择行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57405126/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com