gpt4 book ai didi

linux - 如何通过linux命令递归地从网站中提取电子邮件

转载 作者:太空宇宙 更新时间:2023-11-04 05:04:06 25 4
gpt4 key购买 nike

我想以递归方式提取电子邮件表单网站,这样如果网站有其他电子邮件链接,它也会遍历这些页面并提取电子邮件 ID:s。

我对深度级别 2 执行了以下操作:

wget -r -l 2 -O - some site name |grep -E -o "[a-z0-9.]+@[a-z0-9.-]+.[a-z]{2,4}">>some.txt 

但是当我执行此命令时,它只会创建一个文件“some.txt”,并且不会提取任何电子邮件 ID:s。

最佳答案

为什么不执行递归 wget 并将站点存储在本地,然后在本地文件系统上跨站点执行递归 grep (grep -r)?只需在脚本末尾添加 rm -Rf 即可在完成后删除该站点。

关于linux - 如何通过linux命令递归地从网站中提取电子邮件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22981499/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com