gpt4 book ai didi

python - 基于主题的文本和用户相似度

转载 作者:太空宇宙 更新时间:2023-11-03 14:30:09 25 4
gpt4 key购买 nike

我希望使用主题表示来计算用户和文本文档之间的相似性。 IE。每个文档和用户都由主题向量(例如神经科学、技术等)以及该主题与用户/文档的相关程度表示。

然后我的目标是计算这些向量之间的相似度,以便找到相似的用户、文章和推荐文章。

我曾尝试使用 Pearson Correlation,但一旦达到约 40k 篇文章并且向量的长度约为 10k,它最终会占用太多内存和时间。

我正在使用 numpy。

您能想出更好的方法吗?还是不可避免(在一台机器上)?

谢谢

最佳答案

我建议只使用 gensim为此,而不是自己滚动。

关于python - 基于主题的文本和用户相似度,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12713797/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com