gpt4 book ai didi

html - 如何使用 goquery 从 HTML 页面获取简单文本?

转载 作者:数据小太阳 更新时间:2023-10-29 03:16:41 25 4
gpt4 key购买 nike

我是 Go 的新手。我正在使用 goquery从 HTML 页面中提取数据。但问题是我要查找的数据不受任何 HTML 标记的限制。它是 <br> 之后的简单文本标签。我怎样才能提取它?

编辑:这是 HTML 代码。

<div class="container">
<div class="row">
<div class="col-lg-8">
<p align="justify"><b>Name</b>Priyaka</p>
<p align="justify"><b>Surname</b>Patil</p>
<p align="justify"><b>Adress</b><br>India,Kolhapur</p>
<p align="justify"><b>Hobbies&nbsp;</b><br>Playing</p>
<p align="justify"><b>Eduction</b><br>12th</p>
<p align="justify"><b>School</b><br>New Highschool</p>
</div>
</div>
</div>

从这里我想要“Priyanka”和“12th”。

最佳答案

下面是你想要的:

doc.Find(".container").Find("[align=\"justify\"]").Each(func(_ int, s *goquery.Selection) {
prefix := s.Find("b").Text()
result := strings.TrimPrefix(s.Text(), prefix)
println(result)
})

进口strings在你的代码前面。如果您需要完整的代码示例,请查看 here .

关于html - 如何使用 goquery 从 HTML 页面获取简单文本?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31514414/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com