gpt4 book ai didi

python-3.x - 可视化使用 SpaCy 中的预训练词嵌入计算的余弦相似度分数

转载 作者:行者123 更新时间:2023-12-04 04:23:39 26 4
gpt4 key购买 nike

我使用 SpaCy 的预训练模型“en_core_web_lg”来查找一组值和属性之间的余弦距离。我想可视化一个词与另一个词的接近程度的关系,这与聚类非常相似。

Here is the link to the table which contains similarity scores for each value vs attribute

这里的列是我试图找到相似性得分的属性,而行是我试图找到最有可能被分类的属性的值

This is the output i am trying to achieve. Please take a look at it

最佳答案

如果你想要类似这样的情节: tSNE plot您需要将词向量的维数减少到二维

因此,您必须对所需的词向量应用降维算法,例如 t-SNE (这也在 scikit-learn 中实现)。

相似度分数不足以做到这一点; 你需要完整的载体

Here ,有一个很好的关于 t-SNE 的 Kaggle 教程,用于可视化词向量。您可以自定义它,只选择您感兴趣的词。

关于python-3.x - 可视化使用 SpaCy 中的预训练词嵌入计算的余弦相似度分数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58438813/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com