gpt4 book ai didi

python - 使用 TF-IDF 和余弦相似度匹配短语

转载 作者:行者123 更新时间:2023-11-30 09:41:27 25 4
gpt4 key购买 nike

我有一个如下所示的数据框:

question                                answer
Why did the chicken cross the road? to get to the other side
Who are you? a chatbot
Hello, how are you? Hi
.
.
.

我想做的是使用 TF-IDF 在此数据集上进行训练。当用户输入短语时,将使用余弦相似度选择与该短语最匹配的问题。我可以通过这种方式为训练数据集上的句子创建 TF-IDF 值,但是如何使用它来查找用户输入的新短语的余弦相似度得分?

from sklearn.feature_extraction.text import TfidfVectorizer
v = TfidfVectorizer()
x = v.fit_transform(intent_data["sentence"])

最佳答案

我认为你需要类似的东西

from sklearn.metrics.pairwise import cosine_similarity
cosine_similarities = cosine_similarity(x, v.transform(['user input'])).flatten()
best_match_index = cosine_similarities.argmax()

关于python - 使用 TF-IDF 和余弦相似度匹配短语,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58240401/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com