gpt4 book ai didi

linux - 如何使用linux命令或bash脚本解析大量html文件

转载 作者:太空宇宙 更新时间:2023-11-04 05:53:42 25 4
gpt4 key购买 nike

我正在使用 wget 命令镜像网站。我为此写了一个脚本。该脚本每天通过 crontab 获取站点的副本。镜像存储在 /var/www 下,以便从浏览器(localhost)访问。但我想从 HTML 文件中删除用户输入区域,例如登录或搜索。我可以手动解析文件,但我想用脚本进行解析。你能帮我吗?

最佳答案

也许您正在寻找这样的东西

cat your-html | sed -e 's/\<input.*type="text".*\>//g' | sed -e 's/\<input.*type="password".*\>//g' > new.html

关于linux - 如何使用linux命令或bash脚本解析大量html文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22225878/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com