gpt4 book ai didi

python - python中的 bool 检索模型

转载 作者:太空宇宙 更新时间:2023-11-04 03:54:56 25 4
gpt4 key购买 nike

我正在尝试使用 Python 中的 bool 模型创建一个查询-回答系统。

我尝试使用 nltk,但它似乎没有 bool 模型的函数

我有 3 个文档,我希望看到哪些文档与数​​值更相似。

例如 doc1 2.987、doc2 0.876 和 doc3 2.156 因此 doc1 和 doc2 是相似的

我做了什么:

  • 标记化文档
  • 删除了重复的单词
  • 删除停用词

我现在拥有的是每个文档的唯一单词列表(基本上是名词、动词、副词和形容词)

下一步是什么?

最佳答案

删除停用词可能很有用。您可以查找称为余弦相似度的术语。基本上它可以用于机器学习。它可用于查找文档之间的相似性。你可以找Scikit在 python 中。如果您想使用它,您可以选择。但是这里有一些教程解释了如何计算这种余弦相似度。

part-I , part-II , part-III

也可以看看这个问题

Python: tf-idf-cosine: to find document similarity

希望对你有帮助:)

关于python - python中的 bool 检索模型,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19179706/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com