gpt4 book ai didi

Ruby - 从电子邮件地址中查找文本中的名字和姓氏

转载 作者:太空宇宙 更新时间:2023-11-03 16:28:00 25 4
gpt4 key购买 nike

<分区>

这是一个我一直在研究但无法找到答案的有趣问题。

我有一个包含电子邮件和全名的非结构化数据文本文件。我已经提取了电子邮件,但我还想将名字和姓氏映射到每封电子邮件。

假设电子邮件是 ksmith@gmail.com,页面上某处是“Kevin Smith”。

我想使用“@”前面的任何内容来映射文本中某处的全名。但显然搜索“ksmith”不会返回任何匹配项。那么,从左边开始,我将搜索少一个匹配的字符,即“smith”。

但是当我找到“Smith”时,我还想找到名字。所以也许假设这将永远是姓氏(因为大多数电子邮件都有姓氏而不是名字)并从“Smith”向左搜索直到到达下一个空格(在“Kevin”前面)并计算出两者之间的内容“Smith”和“Kevin”之前的空格是名字。

但是,如果全名是“Kevin Michael Smith”或“Kevin P. Smith”呢?在这种情况下,我不想使用“Michael”或“P.”,而是使用 Kevin 作为名字。

或者,如果电子邮件结构是 smithk@gmail.com,在这种情况下,从左侧收缩子字符串永远不会匹配,我也需要从另一侧尝试。

基本上我需要一种足够智能的方法来在许多情况下识别这些全名。

如有任何帮助,我们将不胜感激!

我正在尝试用 Ruby 来做这件事,如果有帮助的话

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com