gpt4 book ai didi

python - scikit-learn CountVectorizer 中的类型错误

转载 作者:太空宇宙 更新时间:2023-11-04 06:10:26 25 4
gpt4 key购买 nike

我正在尝试使用 scikit-learn 进行一些文本分析。但是,当我尝试调用 CountVectorizer 时,会出现错误。示例代码和引发的错误如下:

    >>> from sklearn.feature_extraction.text import CountVectorizer
>>> corpus = [ 'This is the first document.', 'This is the second second document.', 'And the third one.', 'Is this the first document?', ]
>>> vectorizer = CountVectorizer(min_df=1)
>>> X = vectorizer.fit_transform(corpus)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "/Library/Python/2.6/site-packages/sklearn/feature_extraction/text.py", line 789, in fit_transform
vocabulary, X = self._count_vocab(raw_documents, self.fixed_vocabulary)
File "/Library/Python/2.6/site-packages/sklearn/feature_extraction/text.py", line 716, in _count_vocab
vocabulary = defaultdict(None)
TypeError: first argument must be callable

这是我安装的错误还是什么?其他示例运行良好。

最佳答案

总结评论中的讨论:这是 Python 2.6.1 中的一个错误,已在较新版本的 Python 2.6(以及更高版本的 2.7+、3.2+...)中修复。

关于python - scikit-learn CountVectorizer 中的类型错误,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19007407/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com