gpt4 book ai didi

python - 为文本挖掘创建词汇字典

转载 作者:太空宇宙 更新时间:2023-11-04 07:33:34 24 4
gpt4 key购买 nike

我有以下代码:

train_set = ("The sky is blue.", "The sun is bright.")
test_set = ("The sun in the sky is bright.",
"We can see the shining sun, the bright sun.")

现在我正在尝试像这样计算词频:

    from sklearn.feature_extraction.text import CountVectorizer
vectorizer = CountVectorizer()

接下来我想打印词汇表。因此我这样做:

vectorizer.fit_transform(train_set)
print vectorizer.vocabulary

现在我没有得到输出。虽然我期待这样的事情:

{'blue': 0, 'sun': 1, 'bright': 2, 'sky': 3}

有什么地方出了问题吗?

最佳答案

我想你可以试试这个:

print vectorizer.vocabulary_

关于python - 为文本挖掘创建词汇字典,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41699065/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com