- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
有时,我的电子邮件列表包含同一个人的重复地址。例如,Jane 的地址都是“jane.doe@email.com”和“doe.jane@email”。她的变体包括替换“。”用“-”或“_”。目前,我的重复脚本——由@Jordan Running 和 Ed Nelson 非常友好地升级——处理“严格”的重复,但无法检测到“doe.jane@email.com”是“jane”的“复杂”重复.doe@email.com”。有没有一种方法可以删除甚至这些 重复项,这样我就不会向 Jane 的多个地址发送电子邮件?他们都指向同一个收件箱,所以我只需要包括她的一个地址。
这是我当前的代码:
function removeDuplicates() {
const startTime = new Date();
const newData = [];
const sheet = SpreadsheetApp.getActiveSheet();
const data = sheet.getDataRange().getValues();
const numRows = data.length;
const seen = {};
for (var i = 0, row, key; i < numRows && (row = data[i]); i++) {
key = JSON.stringify(row);
if (key in seen) {
continue;
}
seen[key] = true;
newData.push(row);
};
sheet.clearContents();
sheet.getRange(1, 1, newData.length, newData[0].length).setValues(newData);
// Show summary
const secs = (new Date() - startTime) / 1000;
SpreadsheetApp.getActiveSpreadsheet().toast(
Utilities.formatString('Processed %d rows in %.2f seconds (%.1f rows/sec); %d deleted',
numRows, secs, numRows / secs, numRows - newData.length),
'Remove duplicates', -1);
}
最佳答案
注意事项:
@email.com
部分,它会扭曲结果=removeDuplicatesFuzzy(B2:B12,0.66)
0.66
是模糊匹配的百分比。-
是未找到匹配项(“唯一”值)你可以试试这个库: https://github.com/Glench/fuzzyset.js
要安装它,请复制代码 from here .
用法很简单:
function similar_test(string1, string2)
{
string1 = string1 || 'jane.doe@email.com';
string2 = string2 || 'doe.jane@email.com'
a = FuzzySet();
a.add(string1);
var result = a.get(string2);
Logger.log(result); // [[0.6666666666666667, jane.doe@email.com]]
return result[0][0]; // 0.6666666666666667
}
这里还有更多信息:https://glench.github.io/fuzzyset.js/
注意事项:
javascript 模糊字符串匹配
。这里有相关Q:Javascript fuzzy search that makes sense .注意:该解决方案应适用于 Google 表格(无 ECMA-6)don.jeans@email.com
,它与 doe.jane@email.com
的相似度为 84%,但人类检测到它完全是另一个人.关于javascript - 删除 'complicated' 重复项,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48546170/
我想知道如果我不支持它,如何不显示复杂功能系列。 示例:超大表盘 在 ComplicationController.swift的 getLocalizableSampleTemplate和 getCu
我正在使用 Xcode 10 和 watchos 5。 我已将应用程序图标添加到我的 watchOS 应用程序中,以添加到 Apple Watch 应用程序(阿尔法 channel 和不同尺寸的任何一
Test File 有时,我的电子邮件列表包含同一个人的重复地址。例如,Jane 的地址都是“jane.doe@email.com”和“doe.jane@email”。她的变体包括替换“。”用“-”或
我在 swift 中收到来自 CoreMotion 查询的 CMLogItem(可能是加速度计、陀螺仪)。现在,我想获取该样本的时间戳,最好是 Date() 对象。 CMLogItem 具有类型为 T
我有用 php 编写代码的基本知识,但我被困在逻辑过程中。希望我能在这里得到一些帮助。 问题: 我想根据表现比较并宣布 2 名 worker 之间的获胜者。详情如下: $working_first =
我正在尝试构建一个应用程序,它支持 watch OS2 上的多个复杂功能系列,例如模块化大、实用大、圆形小等,每个都显示来自应用程序的各种有意义的信息。我知道复杂性与我们自 OS1 以来在用户交互方面
我正在尝试安装一个通用的应用程序,以便在其中集成第三方服务。他们有一个OAUTH流程,用户单击一个按钮,然后重定向到他们的网站以登录并“授予”我的应用程序对其服务(有点类似于facebook)的访问权
我正在尝试构建一个正则表达式来筛选有效零件和/或序列号的组合以及范围。 有效的部件号是两个字母、三个数字的模式或/[A-z]{2}\d{3}/ i.e. aa123 or ZZ443 etc... 一
我需要存储由主要 Watch 应用程序(和 iPhone 应用程序)控制并显示在复杂功能中的数据。 official Apple documentation说 If you need to fetch
我一直在努力理解这个程序的输出: #include int main(){ static int arr[] = {0, 1, 2, 3, 4}; int *p[] = {ar
我正在为大学做一个数据库项目,我在这里遇到了一个问题。我试图在没有 session 时显示“登录”,在有 session 时显示“注销”。但实际上即使在我登录后它仍然显示我“登录”并且我尝试 prin
我正在使用 ios 9.2 和 xcode 7.2 在 objective-c 中开发一些 clockkit 并发症 我在这里看了一个很棒的视频 https://developer.apple.com
我正在尝试让自定义 ClockKit Complication 正常工作。 我创建了一个符合 CLKComplicationDataSource 的自定义 ComplicationController
我被问到在 Git 中是否可以执行以下操作,这超出了我的知识范围: 给定以下场景: 我从主干创建了一个新分支“cool-feature”并在其中做了一些工作 我从“cool-feature”创建了另一
在处理了几天的复杂问题之后,对于按规定时间间隔发生的更新的更新过程,我有信心说出以下内容: 系统调用requestedUpdateDidBegin() 在这里您可以确定您的数据是否已更改。如果没有,则
已结束。此问题不符合 Stack Overflow guidelines 。它目前不接受答案。 我们不允许提出有关书籍、工具、软件库等方面的建议的问题。您可以编辑问题,以便用事实和引用来回答它。 关闭
我有这个 JSON 字符串: { "success":true,"user_id":"309","id":"309","sessId":false,"email":null,"name":"Mai
我想将两个查询放在一起;一份来 self 的 posts 表,一份来 self 的 store_products 表,并在同一页面上显示结果。 所以我想拿这个... SELECT p.id
这个问题不太可能帮助任何 future 的访问者;它只与一个小的地理区域、一个特定的时间点或一个非常狭窄的情况相关,这些情况并不普遍适用于互联网的全局受众。为了帮助使这个问题更广泛地适用,visit
我使用this使用规范附带查询参数来生成动态查询的方法。它工作得很好。但通过这种方式,我可以使用简单的 .and() 或 .or()。 我的问题是处理像 where ((a & b)|(c & d)
我是一名优秀的程序员,十分优秀!