gpt4 book ai didi

python - Numpy 在矩阵上按百分比拆分

转载 作者:行者123 更新时间:2023-11-28 22:13:40 24 4
gpt4 key购买 nike

我在理解以下编码时遇到问题,而且我是 python 的新手:

data_a, data_b, data_C = np.split(original_data.sample(frac=1, random_state=1729), 
[int(0.7 * len(original_data)), int(0.9*len(original_data))])

所以我的原始数据集总共有 38000 行。在这种拆分方法之后,data_a 有 26600 行。现在 data_b 有 7600 行,data_c 有 3800 行。所以我确实得到 70% 的 original_data 将是 26600 行。但是为什么 data_b 有 7600 行而 data_c 有 3800 行。我阅读了有关该拆分方法的文档,根据我对编码的理解,我建议在剩下的 30 行中% 数据来 self 最初的 38000 行,90% 将拆分为 data_b,即 10260 行。不是 7600 行。

最佳答案

如果你想将剩余的 30% 分成 90-10,你必须按顺序进行。试试这个!

data_a, remaining_data = np.split(original_data.sample(frac=1, random_state=1729), 
[int(0.7 * len(original_data))])
data_b, data_C = np.split(remaining_data,[int(0.9 * len(remaining_data))])

data_a.shape, data_b.shape, data_C.shape

输出:

((26600,), (10260,), (1140,))

关于python - Numpy 在矩阵上按百分比拆分,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53788707/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com