gpt4 book ai didi

javascript - javascript中的最佳算法分组数据

转载 作者:可可西里 更新时间:2023-11-01 02:45:08 24 4
gpt4 key购买 nike

以下(简化的)json 数据类型定义了联系人:

{
id: number;
name: string;
phone: string;
email: string
}

有如下一组数据:

+---+----------+-------------+---------------------------+ 
|id | name | phone |email |
+---+----------+-------------+---------------------------+
|1 | John | 11111111 |aaaa@test.com |
|2 | Marc | 22222222 |bbbb@test.com |
|3 | Ron | 99999999 |aaaa@test.com |
|4 | Andrew | 55555555 |dddd@test.com |
|5 | Wim | 99999999 |gggg@test.com |
|6 | Marc | 33333333 |cccc@test.com |
|7 | Dan | 44444444 |cccc@test.com |
+---+----------+-------------+---------------------------+

目标是根据以下约束使用 javascript(可选地在 lodash 中,但主要思想是使算法清晰)找到属于一起的组:当以下任何条件相同时,联系人属于一个组: 姓名、电话或电子邮件。结果显示 id 在数组中分组为数组。一组 1 中的联系人将被忽略。

在上面的示例中,这意味着 ID 为 1、3、5 的联系人属于同一个人,因为 1、3 共享相同的电子邮件地址,而 3 和 5 共享相同的电话号码。同样,2、6、7:2 和 6 具有相同的名称,而 6 和 7 具有相同的电子邮件。 5 没有任何共同点。因此预期的结果是:
[[1,3,5], [2,6,7]]

背景:一种可行的解决方案是遍历每个项目并检查列表的其余部分是否名称、电子邮件或电话相同。如果是这样,将它们分组并从列表中取出(在示例中我们将 1 与列表中的所有项目进行比较,但只找到 3)。问题是下一个项目也需要再次检查这些组,因为在这种情况下 5 尚未被检测为组的一部分。这使得算法变得复杂,而我怀疑有一种简单的方法可以在线性时间内解决这个问题。这类问题也可能有一个名称?`

最佳答案

想法:

  • 从 0 个组开始
  • 迭代您的联系人列表
  • 检查是否有包含联系人姓名、电话或电子邮件的群组。将这些组的所有成员合并为同一组。然后将自己添加到该组。如果没有,请以您自己开始一个新群组,并将姓名、电话和电子邮件群组设置为您自己。

联合查找是处理 disjoint sets 合并的有效结构.代码取自 here .由于它使用了路径压缩和按等级联合,你可以认为整个代码在接触量上是线性的。

var data = [
{id:1,name:'John',phone:'11111111',email:'aaaa@test.com'},
{id:2,name:'Marc',phone:'99999999',email:'bbbb@test.com'},
{id:3,name:'Ron',phone:'99999999',email:'aaaa@test.com'},
{id:4,name:'Andrew',phone:'55555555',email:'dddd@test.com'},
{id:5,name:'Wim',phone:'99999999',email:'gggg@test.com'},
{id:6,name:'Marc',phone:'33333333',email:'cccc@test.com'},
{id:7,name:'Dan',phone:'44444444',email:'cccc@test.com'}
];

// UNION-FIND structure, with path comression and union by rank

var UNIONFIND = (function () {

function _find(n)
{
if(n.parent == n) return n;
n.parent = _find(n.parent);
return n.parent;
}

return {
makeset:function(id){
var newnode = {
parent: null,
id: id,
rank: 0
};
newnode.parent = newnode;
return newnode;
},

find: _find,

combine: function(n1, n2) {
var n1 = _find(n1);
var n2 = _find(n2);

if (n1 == n2) return;

if(n1.rank < n2.rank)
{
n2.parent = n2;
return n2;
}
else if(n2.rank < n1.rank)
{
n2.parent = n1;
return n1;
}
else
{
n2.parent = n1;
n1.rank += 1;
return n1;
}
}
};
})();

var groupHash = {name: {}, phone: {}, email: {}}
var groupNodes = []

data.forEach(function(contact){
var group = UNIONFIND.makeset(contact.id);
var groups = new Set();
["name", "phone", "email"].forEach(function(attr){
if (groupHash[attr].hasOwnProperty(contact[attr])) groups.add(groupHash[attr][contact[attr]])
});

groups = Array.from(groups);
groups.push(group);
groupNodes.push(group);

for(var i = 1; i < groups.length; i++) {
UNIONFIND.combine(groups[0], groups[i]);
}

["name", "phone", "email"].forEach(function(attr){
groupHash[attr][contact[attr]] = groups[0];
});

})

var contactsInGroup = {}


groupNodes.forEach(function(group){
var groupId = UNIONFIND.find(group).id;

if (contactsInGroup.hasOwnProperty(groupId) == false) {
contactsInGroup[groupId] = [];
}

contactsInGroup[groupId].push(group.id);
})

var result = Object.values(contactsInGroup).filter(function(list){
return list.length > 1
})

console.log(result)

关于javascript - javascript中的最佳算法分组数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53389734/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com