gpt4 book ai didi

regex - 如何获取使用 bash 构建正则表达式的 TLD 列表?

转载 作者:行者123 更新时间:2023-11-29 09:26:33 25 4
gpt4 key购买 nike

在查找电子邮件地址和主机名的需要中,我们希望改进现有的正则表达式以仅搜索现有的公共(public)顶级域名

我们想要一个 bash 命令,我们可以将其输出复制并粘贴到我们的正则表达式

我们已经对 (co|com) 进行了试用,它仅匹配“co”而不匹配 .com 域的完整“com”顶级域名,这就是为什么顶级域名列表需要按最长排序的原因TLD 的第一个

有人可以提供一行“复制和粘贴”bash 命令 来输出最新的 TLD 排序和格式化列表吗?

最佳答案

在@Alex_Volkov 的帮助下,他在 Regular expression to match DNS hostname or IP Address? 中给出了答案我们被指向了http://data.iana.org/TLD/tlds-alpha-by-domain.txt是 TLD 的来源。

在@thiton 的帮助下,他在 Sorting lines from longest to shortest 中给出了答案可以对输出进行排序,以便首先列出最长的 TLD。

导致这一个类轮:

$ curl -s http://data.iana.org/TLD/tlds-alpha-by-domain.txt | sed '1d; s/^ *//; s/*$//;/^$/d' | awk '{打印长度""$0}' |排序-rn |剪切 -d' ' -f2- | tr '\n' '|' | tr '[:upper:]' '[:lower:]' | sed 's/\(.*\)./\1/'

很好地输出了所需的 TLD 正则表达式部分:

xn--clchc0ea0b2g2a9gcd|xn--hlcj6aya9esc7a|xn--hgbk6aj7f53bba|xn--xkc2dl3a5ee0h|xn--mgberp4a5d4ar|xn--11b5bs3a9aj6g|xn--xkc2al3hye2a|hbxfzcn-80mg |xn--lgbbat1ad8j|xn--mgbx4cd0ab|xn--mgbbh1a71e|xn--mgbayh7gpa|xn--mgbaam7a8h|xn--9t4b11yi5a|xn--ygbi2ammx|xn--yfro4i67o|xn--fzc2c9e2c|xn--3dpcrj9c |xn--ogbpf8fl|xn--mgb9awbf|xn--kgbechtv|xn--jxalpdlp|xn--3e0b707e|xn--s9brj9c|xn--pgbs0dh|xn--kpry57d|xn--kprw13d|xn--j6w193g |xn--h2brj9c|xn--gecrj9c|xn--g6w251d|xn--deba0ad|xn--80ao21a|xn--45brj9c|xn--0zwm56d|xn--zckzah|xn--wgbl6a|xn--wgbh1c |xn--o3cw4h|xn--fiqz9s|xn--fiqs8s|xn--90a3ac|xn--p1ai|旅行|博物馆|帖子|名称|mobi|工作|信息|coop|asia|arpa|aero|xxx|电话|pro|org|net|mil|int|gov|edu|com|cat|biz|zw|zm|za|yt|ye|ws|wf|vu|vn|vi|vg|ve|vc|va| uz|uy|us|uk|ug|ua|tz|tw|tv|tt|tr|tp|to|tn|tm|tl|tk|tj|th|tg|tf|td|tc|sz|sy| sx|sv|su|st|sr|so|sn|sm|sl|sk|sj|si|sh|sg|se|sd|sc|sb|sa|rw|ru|rs|ro|re|qa| py|pw|pt|ps|pr|pn|pm|pl|pk|ph|pg|pf|pe|pa|om|nz|nu|nr|np|no|nl|ni|ng|nf|ne| NC|NA|MZ|米y|mx|mw|mv|mu|mt|ms|mr|mq|mp|mo|mn|mm|ml|mk|mh|mg|me|md|mc|ma|ly|lv|lu|lt| ls|lr|lk|li|lc|lb|la|kz|ky|kw|kr|kp|kn|km|ki|kh|kg|ke|jp|jo|jm|je|it|is|ir| iq|io|in|im|il|ie|id|hu|ht|hr|hn|hm|hk|gy|gw|gu|gt|gs|gr|gq|gp|gn|gm|gl|gi| gh|gg|gf|ge|gd|gb|ga|fr|fo|fm|fk|fj|fi|eu|et|es|er|eg|ee|ec|dz|do|dm|dk|dj| de|cz|cy|cx|cw|cv|cu|cr|co|cn|cm|cl|ck|ci|ch|cg|cf|cd|cc|ca|bz|by|bw|bv|bt| bs|br|bo|bn|bm|bj|bi|bh|bg|bf|be|bd|bb|ba|az|ax|aw|au|at|as|ar|aq|ao|an|am| al|ai|ag|af|ae|ad|ac

关于regex - 如何获取使用 bash 构建正则表达式的 TLD 列表?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14460680/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com