gpt4 book ai didi

python - SMOTE后保留pandas数据帧结构,在python中过采样

转载 作者:行者123 更新时间:2023-12-03 18:44:17 24 4
gpt4 key购买 nike

问题: 在实现 SMOTE(一种过采样)时,我的 数据帧被转换为 numpy 数组 )。

test_train_split

from sklearn.model_selection import train_test_split
X_train, X_test, y_train_full, y_test_full = train_test_split(X, y, test_size=0.20, random_state=66)
[IN]type(X_train)
[OUT]pandas.core.frame.DataFrame

在 SMOTE 之后,X_train 的数据类型从 pandas 数据帧变为 numpy 数组
from imblearn.over_sampling import SMOTE
sm = SMOTE(random_state = 42)
X_train, y_train = sm.fit_sample(X_train, y_train)
[IN]type(X_train)
[OUT]numpy.ndarray

预期输出
我想在 SMOTE 之后保留 X_train 和 X_test 的数据帧结构。怎么做?

最佳答案

我找到了一个更简单的答案:

from imblearn.over_sampling import SMOTE
sm = SMOTE(random_state = 42)
X_train_oversampled, y_train_oversampled = sm.fit_sample(X_train, y_train)
X_train = pd.DataFrame(X_train_oversampled, columns=X_train.columns)

这有助于在 SMOTE 之后保留数据帧结构

关于python - SMOTE后保留pandas数据帧结构,在python中过采样,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/60432496/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com