gpt4 book ai didi

algorithm - 什么算法计算一组集合中公共(public)元素的频率?

转载 作者:塔克拉玛干 更新时间:2023-11-03 05:12:17 29 4
gpt4 key购买 nike

我想要有关算法的信息,这些算法可以帮助识别重叠数据集之间的共性和差异。

以stackoverflow的标签系统为例:

假设这个问题有 5 个标签。假设有 1000 个其他问题至少具有这些标签之一。在这 1000 个问题中,有多少问题具有我的原始帖子没有的共同标签?

另一种更简单的描述方式是自动建议标记系统:

“你用 [我选择的 5 个标签] 标记了你的问题。其他类似的问题用 [可能感兴趣的标签列表] 标记了。其中 [可能感兴趣的标签列表] 是经常出现的标签' 在我的原始列表中。

如果可能,使用 C# 编写代码示例 :)

最佳答案

查看 Wager-Hamming 距离。这是字符串上定义的汉明距离,表示将一个字符串转换为另一个字符串所需的编辑操作次数。

您还可以潜在地使用等价类的部分顺序和集合包含:当问题 A 和 B 具有完全相同的标记集直到重新排序时,它们相等,设置并集、设置差异和设置交集,然后定义< 和 > 比较的偏序。

关于algorithm - 什么算法计算一组集合中公共(public)元素的频率?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/376019/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com