gpt4 book ai didi

python-3.x - 如何在 Python 中创建 k 重分层的实际数据帧

转载 作者:行者123 更新时间:2023-11-30 09:03:18 25 4
gpt4 key购买 nike

从我从sklearn Stratifiednfold返回的索引中,如何从每个折叠创建相应的数据框?

skf = StratifiedKFold(n_splits=10)
skf.get_n_splits(X, y)

for train_index, test_index in skf.split(X, y):
print("TRAIN:", train_index, "TEST:", test_index)

打印出带有索引的列表。如何将这些映射回我的原始数据框?

我需要它们,因为我想在运行我的文本分类模型之前将增强数据添加到训练数据中。

最佳答案

您可以使用您拥有的索引列表过滤原始数据框,如下所示:

df = pd.DataFrame({'foo': ['a', 'b', 'c', 'd', 'e']})
indices = [0, 2, 4]
df = df[df.index.isin(indices)]

输出:

  foo
0 a
2 c
4 e

关于python-3.x - 如何在 Python 中创建 k 重分层的实际数据帧,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59268166/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com