gpt4 book ai didi

python - 如何在多个列上进行 Pandas 样本?

转载 作者:行者123 更新时间:2023-12-01 00:17:37 31 4
gpt4 key购买 nike

我有一个包含大约 800 万个观察值的数据框。我需要从中提取样本,但想从多个列中采样。

我尝试了以下方法,但不起作用:

import pandas as pd

state = ['mi', 'mi', 'mi', 'nc', 'pa', 'pa', 'ga']
state = state * 50
age = ['21', '22', '23', '23', '23', '50', '50']
age = age * 50
random = ['.445', '.324', '.234', '.143', '.568', '.777', '.256']
random = random * 50
data = {'state':state, 'age': age, 'random': random}
df = pd.DataFrame.from_dict(data = data)

df_sample = df.sample(n = 25, weights = ['state', 'age'], random_state = 48)

我意识到pandas文档没有说明我想做的事情是可能的。有什么办法可以做到这一点吗?

最佳答案

IIUC,

我认为您希望实现以下目标:

df_sample = df[['state','age']].sample(n = 25, random_state = 48)

关于python - 如何在多个列上进行 Pandas 样本?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59202341/

31 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com