gpt4 book ai didi

algorithm - 如何计算Facebook中两个用户的相似度?

转载 作者:塔克拉玛干 更新时间:2023-11-03 02:51:32 25 4
gpt4 key购买 nike

<分区>

我正在从事一个关于数据挖掘的项目。我的公司给了我 600 万个 Facebook 虚拟客户信息。我被指派找出任意两个用户之间的相似性。任何人都可以给我一些如何处理大型社区数据的想法吗?提前致谢:)

问题:我使用状态信息和主题标签信息(主题标签是用户突出显示的那些词)作为两个标准来衡量两个不同用户之间的相似性。由于用户数量众多,尤其是每个用户可能有数百万个主题标签和状态。谁能告诉我快速计算两个用户之间相似度的好方法?我曾尝试使用 TF-IDF 来计算两个不同用户之间的相似度,但似乎不可行。任何人都可以有一个非常强大的算法或好主意可以让我快速找到用户之间的所有相似之处吗?

例如:

user A's hashtag = `{cat, bull, cow, chicken, duck}`
user B's hashtag =`{cat, chicken, cloth}`
user C's hashtag = `{lenovo, Hp, Sony}`

很明显,C和A没有关系,所以没必要去计算相似度浪费时间,我们可以先过滤掉所有不相关的用户再计算相似度。事实上,超过 90% 的用户与特定用户无关。如何以hashtag为标准快速找到A的潜在相似用户群?这是一个好主意吗?还是直接计算A和其他所有用户的相对相似度?对于该问题,哪种算法是最快的定制算法?

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com