gpt4 book ai didi

python - 自动特征选择 - Sklearn.feature_selection

转载 作者:行者123 更新时间:2023-11-30 08:58:00 25 4
gpt4 key购买 nike

我有两个数据集:训练数据和测试数据。 train.shape = (307511, 122) 和 test.shape = (48744, 121)。这两个数据集都包含以下数据类型:int32、float64 和 object。

我进行了热编码,将对象转换为 float 或 int 数据类型。

train = pd.get_dummies(train)
test = pd.get_dummies(test)
print('Train dummies shape: {}'.format(train.shape))
print('Test dummies shape: {}'.format(test.shape))

我从上面的代码中得到了这些结果:

Train dummies shape: (307511, 246)
Test dummies shape: (48744, 242)

形状已改变,因此 HotEncoding 已成功。但现在我面临的问题是,当我尝试训练和测试我的数据时,我收到此错误:

ValueError: Input contains NaN, infinity or a value too large for dtype('float32')

这些是我的导入:

from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import train_test_split
from sklearn.feature_selection import SelectFromModel
from sklearn.ensemble import ExtraTreesClassifier

请帮忙

最佳答案

试试这个:

train.as_matrix().astype(np.float)
test.as_matrix().astype(np.float)

关于python - 自动特征选择 - Sklearn.feature_selection,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52168051/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com