gpt4 book ai didi

python - NLTK SklearnClassifier 错误

转载 作者:行者123 更新时间:2023-11-28 22:52:29 25 4
gpt4 key购买 nike

我正在尝试使用 NLTK 的 SklearnClassifier 和 MultinomialNB 对文本文档进行分类。这是代码:

pipeline = Pipeline([('tfidf', TfidfTransformer()),
('chi2', SelectKBest(chi2, k=1000)),
('nb', MultinomialNB())])
classifier = SklearnClassifier(pipeline)

test_skl = []
t_test_skl = []
for d in test_set:
test_skl.append(d[0])
t_test_skl.append(d[1])

p_class = classifier.batch_classify(test_skl)

print classification_report(t_test_skl, p_class, labels=list(set(t_test_skl)),target_names=cls_set)

我收到这个错误:

Traceback (most recent call last):
File "classify.py", line 72, in <module>
p_class = classifier.batch_classify(test_skl)
File "/Users/me/anaconda/lib/python2.7/site-packages/nltk-3.0a3-py2.7.egg/nltk/classify/scikitlearn.py", line 84, in batch_classify
X = self._vectorizer.transform(featuresets)
File "/Users/me/anaconda/lib/python2.7/site-packages/sklearn/feature_extraction/dict_vectorizer.py", line 213, in transform
vocab = self.vocabulary_
AttributeError: 'DictVectorizer' object has no attribute 'vocabulary_'

我正在使用 NLTK 3.0a3 和 scikit-learn 0.14.1。

有什么线索吗?

谢谢

最佳答案

还没有训练分类器。在尝试对任何内容进行分类之前调用​​其 train 方法。 (作为这段代码的作者,我承认错误信息可以更友好一些。)

关于python - NLTK SklearnClassifier 错误,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20403876/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com