gpt4 book ai didi

python - 在 TfidfVectorizer() 中输入文档术语频率矩阵?

转载 作者:行者123 更新时间:2023-12-01 01:49:38 25 4
gpt4 key购买 nike

我正在想出一个来自三个文档的词袋的虚构示例(我正在演示 tf-idf 如何在给定文档术语频率矩阵的情况下工作),并且我想将我的弓矩阵转换为 tf- idf 矩阵。我实际上没有文本数据,只有我在示例中编写的数字?我如何使用它来生成 tf-idf 输出?我在最后一行收到错误消息“'numpy.ndarray'对象没有属性'lower'”(我假设这是因为 fit_transform 正在等待文本数据。是否可以指定或者以某种方式覆盖它?

bow = np.array([[15,0,5,0,20], [20,30,0,25,0], [15,10,10,20,15]])
vectorizer = TfidfVectorizer()
vectorizer.fit_transform(bow)

最佳答案

您可以使用 TfidfTransformer 代替 TfidfVectorizer。

from sklearn.feature_extraction.text import TfidfTransformer
import numpy as np

bow = np.array([[15,0,5,0,20], [20,30,0,25,0], [15,10,10,20,15]])
transformer = TfidfTransformer()
transformer.fit_transform(bow)

关于python - 在 TfidfVectorizer() 中输入文档术语频率矩阵?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50862474/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com