gpt4 book ai didi

html - 在 Shell 脚本中使用 CURL 解析 HTML

转载 作者:行者123 更新时间:2023-12-02 00:35:32 25 4
gpt4 key购买 nike

我正在尝试在 shell 脚本中解析网页的特定内容。

我需要grep <div>里面的内容标签。

<div class="tracklistInfo">
<p class="artist">Diplo - Justin Bieber - Skrillex</p>
<p>Where Are U Now</p>
</div>

如果我使用grep -E -m 1 -o '<div class="tracklistInfo">' ,简历只有<div class="tracklistInfo">

如何访问艺术家 (Diplo - Justin Bieber - Skrillex)以及标题如何(Where Are U Now)

最佳答案

使用 xmllint:

a='<div class="tracklistInfo">
<p class="artist">Diplo - Justin Bieber - Skrillex</p>
<p>Where Are U Now</p>
</div>'

xmllint --html --xpath 'concat(//div[@class="tracklistInfo"]/p[1]/text(), "#", //div[@class="tracklistInfo"]/p[2]/text())' <<<"$a"

您获得:

Diplo - Justin Bieber - Skrillex#Where Are U Now

可以很容易地分开。

关于html - 在 Shell 脚本中使用 CURL 解析 HTML,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36157116/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com