gpt4 book ai didi

python - 两个 100X100 多维数组的随机样本,具有相同的行号。在 python 中

转载 作者:行者123 更新时间:2023-11-28 21:35:05 24 4
gpt4 key购买 nike

我在 numpy 中有两个多维数组(矩阵),一个是训练集(100,100 维),另一个是类标签(100X1 维)我想使用 np.random.choice 随机抽样但不知道如何弄清楚采取同一行没有。来自两个矩阵。

例如,

k=np.random.choice(10,replace=False)
temp_data=data.ix[k]
temp_datat=datat.ix[k]

这是否适用于从我的数组数据和数据中抽取 10 个相同的随机行?

最佳答案

@Umang Gupta 建议的一种不同方法,如果您还想跟踪那些未选择的方法,可能会有所帮助

# Suppose X_train is your 100 x 100 dataset
# and y_train is your array of labels
idx = np.arange(len(X_train))
np.shuffle(idx)

NUM_SAMPLES = 50
sampled_idxs = idx[:NUM_SAMPLES]
rest_idxs = idx[NUM_SAMPLES:]

X_samples = X_train[sampled_idxs]
X_rest = X_train[rest_idxs]
y_samples = y_train[sampled_idxs]
y_rest = y_train[rest_idxs]

如果您已经安装了 Scikit-Learn,您可以使用 test_train_split

from sklearn.model_selection import test_train_split
X_samples, X_rest, y_samples, y_rest = train_test_split(X_train, y_train,
train_size=NUM_SAMPLES,
random_state=123)

关于python - 两个 100X100 多维数组的随机样本,具有相同的行号。在 python 中,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52712295/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com