gpt4 book ai didi

python imblearn make_pipeline 类型错误 : Last step of Pipeline should implement fit

转载 作者:太空宇宙 更新时间:2023-11-03 11:15:16 27 4
gpt4 key购买 nike

我正在尝试在管道内实现 imblearn 的 SMOTE。我的数据集是存储在 Pandas 数据框中的文本数据。请看下面的代码片段

text_clf =Pipeline([('vect', TfidfVectorizer()),('scale', StandardScaler(with_mean=False)),('smt', SMOTE(random_state=5)),('clf', LinearSVC(class_weight='balanced'))])

在此之后,我正在使用 GridsearchCV。

grid = GridSearchCV(text_clf, parameters, cv=4, n_jobs=-1, scoring = 'accuracy') 

其中的参数只不过是主要针对 TfidfVectorizer() 的调整参数。我收到以下错误。

 All intermediate steps should be transformers and implement fit and transform. 'SMOTE

发布这个错误,我已经将代码更改为如下。

vect = TfidfVectorizer(use_idf=True,smooth_idf = True, max_df = 0.25, sublinear_tf = True, ngram_range=(1,2))
X = vect.fit_transform(X).todense()
Y = vect.fit_transform(Y).todense()
X_Train,X_Test,Y_Train,y_test = train_test_split(X,Y, random_state=0, test_size=0.33, shuffle=True)
text_clf =make_pipeline([('smt', SMOTE(random_state=5)),('scale', StandardScaler(with_mean=False)),('clf', LinearSVC(class_weight='balanced'))])
grid = GridSearchCV(text_clf, parameters, cv=4, n_jobs=-1, scoring = 'accuracy')

parameters 只是调整 SVC 分类器中的 C。这次我收到以下错误:

Last step of Pipeline should implement fit.SMOTE(....) doesn't

这是怎么回事?有人可以帮忙吗?

最佳答案

imblearn.SMOTE 没有transform 方法。文档是 here .

但是管道中除了最后一步之外的所有步骤都应该有它,以及 fit

要将 SMOTE 与 sklearn 管道一起使用,您应该在 transform 方法中实现一个调用 SMOTE.fit_sample() 的自定义转换器。

另一个更简单的选择是使用 ibmlearn 管道:

from imblearn.over_sampling import SMOTE
from imblearn.pipeline import Pipeline as imbPipeline

# This doesn't work with sklearn.pipeline.Pipeline because
# SMOTE doesn't have a .tranform() method.
# (It has .fit_sample() or .sample().)
pipe = imbPipeline([
...
('oversample', SMOTE(random_state=5)),
('clf', LinearSVC(class_weight='balanced'))
])

关于python imblearn make_pipeline 类型错误 : Last step of Pipeline should implement fit,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53114668/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com