gpt4 book ai didi

python - 如何按比例将数据分为训练集和测试集?

转载 作者:行者123 更新时间:2023-11-28 21:35:42 31 4
gpt4 key购买 nike

如何编写一个采用数据集(我正在使用虹膜)并创建一个测试和数据集的函数,并按比例表示每个类别(标签)?

def train_test_split(data, labels, n, test_proportion)


其中n是类别数

输出的test_data应该包含数据的test_proportion%,其中test_labels包含与test_data中的数据相对应的正确标签;然后train_data应该包含其余数据,train_labels包含train_data中特征向量的标签。

test_data和train_data在n个类别中都应具有相等的比例。例如,对于n = 3,则test_data和train_data都包含类别0的1/3观测值,类别1的1/3和类别2的1/3,即使test_data和train_data可能包含不同数量的条目(当test_proportion与0.5不同)。

最佳答案

关于python - 如何按比例将数据分为训练集和测试集?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59021865/

31 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com