gpt4 book ai didi

scikit-learn - CountVectorizer 的 sklearn 部分拟合

转载 作者:行者123 更新时间:2023-12-02 11:21:56 26 4
gpt4 key购买 nike

是否CountVectorizer支持部分合身吗?

我要培训CountVectorizer使用不同批次的数据。

最佳答案

不,它不支持部分拟合。
但是您可以编写一个简单的方法来实现您的目标:

def partial_fit(self , data):
if(hasattr(vectorizer , 'vocabulary_')):
vocab = self.vocabulary_
else:
vocab = {}
self.fit(data)
vocab = list(set(vocab.keys()).union(set(self.vocabulary_ )))
self.vocabulary_ = {vocab[i] : i for i in range(len(vocab))}

from sklearn.feature_extraction.text import CountVectorizer
CountVectorizer.partial_fit = partial_fit

vectorizer = CountVectorizer(stop_words=l)
vectorizer.fit(df[15].values[0:100])
vectorizer.partial_fit(df[15].values[100:200])

关于scikit-learn - CountVectorizer 的 sklearn 部分拟合,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40289243/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com