gpt4 book ai didi

python - fit_transform 后数组大小不同

转载 作者:太空宇宙 更新时间:2023-11-03 13:40:29 25 4
gpt4 key购买 nike

我对 fit_transform 函数有疑问。有人可以解释为什么数组的大小不同吗?

In [5]: X.shape, test.shape

Out[5]: ((1000, 1932), (1000, 1932))

In [6]: from sklearn.feature_selection import VarianceThreshold
sel = VarianceThreshold(threshold=(.8 * (1 - .8)))
features = sel.fit_transform(X)
features_test = sel.fit_transform(test)

In [7]: features.shape, features_test.shape

Out[7]:((1000, 1663), (1000, 1665))

UPD:哪种转换可以帮助我获得相同大小的数组?

最佳答案

这是因为您两次调整您的选择器

首先,请注意 fit_transform 只是调用 fit,然后调用 transform

fit 方法允许您的 VarianceThreshold 选择器根据您提供的参数找到它想要保留在数据集中的特征。

transform 方法执行实际的特征选择并返回仅包含所选特征的 n 数组。

关于python - fit_transform 后数组大小不同,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32311728/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com