gpt4 book ai didi

regex - 从网页中删除所有 HTML 标签

转载 作者:行者123 更新时间:2023-11-29 09:09:10 25 4
gpt4 key购买 nike

我正在使用 curl 编写一些 BASH shell 脚本.如果我的 curl 命令返回任何文本,我就知道我有一个错误。此文本由 curl 返回通常在 HTML 中。我想如果我可以去除所有 HTML 标记,我可以将结果文本显示为错误消息。

我在想这样的事情:

sed -E 's/<.*?>//g' <<<$output_text

但我得到 sed: 1: "s/<.*?>//": RE error: repetition-operator operand invalid

如果我替换 *?* ,我没有收到错误(我也没有收到任何文本)。如果我删除 global ( g ) 标志,我会得到同样的错误。

这是在 Mac OS X 上。

最佳答案

sed 不支持非贪婪。

尝试

's/<[^>]*>//g'

关于regex - 从网页中删除所有 HTML 标签,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17845056/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com