gpt4 book ai didi

python - 训练后如何使用 countVectorizer 测试新数据

转载 作者:太空宇宙 更新时间:2023-11-04 09:30:19 32 4
gpt4 key购买 nike

我是这样使用 countVectorizer 的:

from sklearn.feature_extraction.text import CountVectorizer  
vectorizer = CountVectorizer(max_features=200, min_df=2, max_df=0.7,
stop_words=stopwords.words('arabic'))
X = vectorizer.fit_transform(X).toarray()

现在这段代码会将字符串转换为二进制,然后我要训练数据。但是,我现在有一些小的测试数据。我怎样才能把它转换成二进制形式,这样我才能真正进行比较?

最佳答案

只需使用适合训练数据的vectorizer 将文本转换为训练模型所期望的相同格式:

test_vectors = vectorizer.transform(test_text_data)

关于python - 训练后如何使用 countVectorizer 测试新数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55994883/

32 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com