作者热门文章
- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我知道如何从 pandas 数据框中随机抽取几行。假设我有一个数据框 df,然后为了获得一小部分行,我可以这样做:
df_sample = df.sample(frac=0.007)
但是我需要的是上述数据框中的随机行和随机列。
Df 当前为 56Kx8.5k。如果我想说 500x1000,其中 500 和 1000 都是随机抽样的,该怎么做?
我认为一种方法是做类似的事情
df.columns 获取列名列表。
然后对这个列列表的索引进行一些随机抽样,并使用该随机索引过滤掉剩余的列?
最佳答案
只需调用 sample
两次,并使用相应的轴参数:
df.sample(n=500).sample(n=1000, axis=1)
对于第一个,axis=0 默认。第一个采样采样行,第二个采样考虑列。
关于python - Pandas 数据框的随机抽样(行和列),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38087032/
如何从填充有 1 和 0 的矩阵中抽取 n 个随机点的样本? a=rep(0:1,5) b=rep(0,10) c=rep(1,10) dataset=matrix(cbind(a,b,c),nrow
这个问题在这里已经有了答案: How to efficiently get 10% of random numbers, then 10% of remaining 90 etc untill al
我有一个与它非常相似的数据框,但有数千个值: import numpy as np import pandas as pd # Setup fake data. np.random.seed([3,
我是一名优秀的程序员,十分优秀!