gpt4 book ai didi

regex - 在大文本中找到某种模式的有效方法是什么?

转载 作者:行者123 更新时间:2023-12-01 07:28:38 25 4
gpt4 key购买 nike

我想从一个大文本文件中提取电子邮件地址。最好的方法是什么?

我的想法是在文本中找到 '@' 并使用“正则表达式”在该位置之前(例如)256 个字符和 512 长度的子字符串中找到电子邮件地址。

P.S.:坦率地说,我想知道在巨大文本中查找某些模式(如电子邮件地址)的最佳和最有效的方法。

最佳答案

256 和 512 听起来像是任意值。

  • 你确实可以扫描@符号,但你必须往前读向后,直到你遇到一个中不允许的字符电子邮件地址(例如,另一个@符号、空格、反斜杠...)
  • 引用维基百科:

The local-part of an e-mail address may be up to 64 characters long and the domain name may have a maximum of 255 characters.

所以这些值会更好。

现在结合这两种方法,瞧,你有你的算法。

关于regex - 在大文本中找到某种模式的有效方法是什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2816358/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com