作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有一个数据框,我想对其进行采样。但是,在随机采样时,我希望从列中的每个元素中至少有 1 个样本。我也希望分布也有影响。(例如:原始样本更多的值对采样的 df 有更多影响)
类似于 this和 this问题,但每组的样本量最小。
让我们说这是我的 df:
df = pd.DataFrame(columns=['class'])
df['class'] = [0,0,0,0,0,0,0,0,0,0,0,0,0,1,2]
df_sample = df.sample(n=4)
当我采样时,我希望 df_sample 看起来像:
Class
0
0
1
2
谢谢你。
最佳答案
正如@YukiShioriii 所建议的那样,您可以:
1 - 对每组值采样一行
2 - 无论值如何,对其余行随机抽样
关于python - 每组随机样本,有 min_rows,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/63811376/
我有一个数据框,我想对其进行采样。但是,在随机采样时,我希望从列中的每个元素中至少有 1 个样本。我也希望分布也有影响。(例如:原始样本更多的值对采样的 df 有更多影响) 类似于 this和 thi
我是一名优秀的程序员,十分优秀!