gpt4 book ai didi

mysql - 在 mysql 列中查找不连续的重复文本

转载 作者:行者123 更新时间:2023-11-29 05:14:50 25 4
gpt4 key购买 nike

我有一个包含大量电子邮件地址的数据库。

由于脚本中的错误,数据库中充满了错误的电子邮件地址。这些地址具有已知模式。

它们由一个真实的电子邮件地址组成,并在开头与一个字符串连接。该字符串本身就是电子邮件地址的一部分。

例子:

正确的电子邮件应该是:

john.doe@example.com

相反,我有:

doejohn.doe@example.com

或者还有:

johndoejohn.doe@example.com

我如何识别这些地址?

我想过创建一个正则表达式来查找字符串中的重复文本,但我想不出如何去做。

有什么想法吗?

最佳答案

您可以使用下面的查询来处理 LASTNAMEfirstname.lastname@something.com 模式,这将首先找到 last_name,然后在第一个 之前的第一部分中将其替换为 null。

concat(replace(substr(email,1,locate('.',email)),substr(email,LOCATE('.',email)+1,locate('@',email)-LOCATE('.',email)-1),'')
,
substr(email,locate('.',email)+1,length(email))
)

请参阅此处的 SQL Fiddle 示例

http://sqlfiddle.com/#!9/24fba/2

但这不会处理 FIRSTNAMelastnameFIRSTNAME.lastname@example.com 模式。

关于mysql - 在 mysql 列中查找不连续的重复文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34491004/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com