gpt4 book ai didi

python - 在 scikit-learn 中组合特征提取类

转载 作者:太空狗 更新时间:2023-10-29 16:56:15 26 4
gpt4 key购买 nike

我正在使用 sklearn.pipeline.Pipeline 链接特征提取器和分类器。有没有办法并行组合多个特征选择类(例如来自 sklearn.feature_selection.text 的那些)并加入它们的输出?

我的代码现在看起来如下:

pipeline = Pipeline([
('vect', CountVectorizer()),
('tfidf', TfidfTransformer()),
('clf', SGDClassifier())])

结果如下:

vect -> tfidf -> clf

我希望能够指定如下所示的管道:

vect1 -> tfidf1 \
-> clf
vect2 -> tfidf2 /

最佳答案

最近在 scikit-learn 的主分支中以 FeatureUnion 的名称实现了这一点:

http://scikit-learn.org/dev/modules/pipeline.html#feature-union

关于python - 在 scikit-learn 中组合特征提取类,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12721486/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com