gpt4 book ai didi

mysql - 如何将没有模式的一列更改为明确定义的行和列?

转载 作者:行者123 更新时间:2023-11-29 22:24:22 24 4
gpt4 key购买 nike

寻找使用 SQL 或 Excel 来清理没有明确模式的约 100k 记录表的任何技巧。数据通常看起来像这样,全部被阻塞在不同的行但同一列中:

JENNIFER SMITH
Accountant - Senior
Day Shift
jsmith@mail.com

AMBER Jones
Professional
Pro Status

amberj@mail.com

Abby Stone
Receptionist
Analytics
123 Main St
123-456-7890
abby@mail.com

REBECCA MILLER
Media
Building 2
millerr@mail.com
Sarah M Myers
Executive
BRADBURY SCHOOL
456 Main St

最大的问题是,有些记录下面有三组附加数据,有些记录有五组——也许他们有电子邮件和/或电话号码,也许没有,有些记录后面有几行,有些没有。 t等

我正在寻找使用代码或公式的想法来尝试将其清理为如下所示,而无需手动遍历每一行:

Name            Job                 Info        Email          Phone           Address
JENNIFER SMITH Accountant - Senior Day Shift jsmith@mail.com
AMBER Jones Professional Pro Status amberj@mail.com
Abby Stone Receptionist Analytics abby@mail.com 123-456-7890 123 Main St
REBECCA MILLER Media Building 2 millerr@mail.com
Sarah M Myers Executive BRADBURY SCHOOL 456 Main St

希望人们能够利用他们过去不得不在像这样出现的非常困惑的数据集上使用的场景来产生想法。如果是在 Excel 中,则可能是使用 SEARCH() 或 LEN() 的某种组合来尝试识别每个记录的数据何时结束。

我知道这不是最尖锐的问题 - 但如果有人有任何提示,那真的会对我有帮助。它也不必最终变得完美——如果它最终看起来像上面那样,我将能够从那时起手动清理它,而不是从一开始就清理它。

任何使用任何方法的帮助将不胜感激!

最佳答案

你会花更多的时间来处理这个代码,而不是值得的。这种格式错误的数据不可能准确。您到底如何知道詹妮弗·史密斯仍然使用指定的电子邮件地址或列出了该职位?如果您被迫处理这些数据,那么您最好花钱请人输入。这不会超过一周,而且您可能可以花几百美元找人来做这件事。即便如此,这些数据肯定是垃圾,所以我看不出有什么必要费心。

关于mysql - 如何将没有模式的一列更改为明确定义的行和列?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30408679/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com