gpt4 book ai didi

html - 如何在bash中仅使用grep提取html标签

转载 作者:太空宇宙 更新时间:2023-11-04 05:36:10 24 4
gpt4 key购买 nike

所以我有这个代码

<span class="cur_wind">Sunrise <b>7:33 a.m.</b> <br />

我想使用 grep 来提取其中的日出时间和日落时间。我该怎么做?我只想使用 grep,因为我不熟悉 awk 和 sed 等。干杯!

最佳答案

确实不是这里的方法,但是如果您没有任何额外的时间运算符,像下面这样的原始方法可能会起作用。

grep -oP "(Sunrise|Sunset|\d+:\d+ (a.m|p.m))" 

示例输出

> cat file
<td valign="top"><span class="cur_wind">Sunrise <b>7:33 a.m.</b> <br />
Sunset&nbsp; <b>7:17 p.m.</b></span></td>
> grep -oP "(Sunrise|Sunset|\d+:\d+ (a.m|p.m))" file
Sunrise
7:33 a.m
Sunset
7:17 p.m

或者,像这样的事情可能会消除更多错误情况

grep -oP "(Sunrise(.*)\d+:\d+ (a.m|p.m))|(Sunset(.*)\d+:\d+ (a.m|p.m))" file 
Sunrise <b>7:33 a.m
Sunset&nbsp; <b>7:17 p.m

您可以通过管道发送到 再次删除标签字符。

关于html - 如何在bash中仅使用grep提取html标签,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22741358/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com