gpt4 book ai didi

java - 如何高效计算数百万字符串之间的余弦相似度

转载 作者:太空狗 更新时间:2023-10-29 21:59:55 27 4
gpt4 key购买 nike

<分区>

我需要计算列表中字符串之间的余弦相似度。例如,我有一个超过 1000 万个字符串的列表,每个字符串都必须确定自己与列表中每个其他字符串之间的相似性。我可以用来高效快速地完成此类任务的最佳算法是什么?分而治之算法是否适用?

编辑

我想确定哪些字符串与给定字符串最相似,并能够获得与相似性相关联的度量/分数。我认为我想做的事情符合最初不知道集群数量的集群。

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com