gpt4 book ai didi

javascript - 在 MongoDb 中查找两个集合之间的交集

转载 作者:可可西里 更新时间:2023-11-01 10:07:37 24 4
gpt4 key购买 nike

我有两个非常大的集合(超过 30000 个文档),一个包含从文本文件中提取的单词(集合名称“word”),另一个包含字典中的单词(集合名称“dictionary”)。

如何获取两个集合中都存在的单词?

(我已经简化了情况,'word' 集合中的文档包含有关单词的元数据,因此每个单词都必须是一个单独的文档。)

最佳答案

将两个集合复制到一个集合中(如有必要,包括一个鉴别器字段,以便您可以分辨每个实例中的文档类型)。

对该集合运行 map-reduce

在 Map 中,发出单词作为键和值,例如 {instance:1, dict:0}{instance:0, dict:1}取决于被映射的文档是实例还是字典条目。 (您可以根据需要在此处将更多字段添加到值中。)

在 Reduce 中,累积分数(像往常一样)。

现在执行查询以查找 instance > 0dict > 0 并且您拥有两者中的所有单词。

关于javascript - 在 MongoDb 中查找两个集合之间的交集,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7389150/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com