gpt4 book ai didi

html - GoLang - GoQuery HTML 插入失败

转载 作者:数据小太阳 更新时间:2023-10-29 03:37:23 31 4
gpt4 key购买 nike

我想提取 elementB ,然后在元素 C 之前停止和 D - 即不提取 .text内容elementCelementD .但是,我只知道如何提取整个 div 文本,使用 Contents().Not忽略 elementC ,但是elementD仍然被捕获。

这是我目前使用的代码:

高语:

capturedText := s.Find("div").Contents().Not(".label").Text()

忽略 elementC , 但不是 elementD , 它没有外部标签。

HTML:

<li><span><h2>elementA</h2></span><div>elementB<br><span class="label">elementC</span>elementD</div></li>

如何只捕获 elementB<div> ,而不是 elementCelementD

编辑:

我试过像这样关闭 div 标签:

s.Find(".label").BeforeHtml(`</div>`)

也尝试过:

s.Find(".label").BeforeHtml(`</div><div>`)

并访问第一个 div , 忽略第二个 div现在应该有 elementD与:

jp, _ := s.Find("div").First().Html()

但是,这是行不通的。似乎</div>不能是开放标签 - 它必须是 <div>...</div>正确插入。但这不是我需要的,我只需要 </div></div><div>关闭第一个div正确。

解决这个问题的合适方法是什么?

最佳答案

由于我无法使用“损坏的”节点编辑 HTML,因此我选择了这个:

    s.Find(".label").BeforeHtml(`|_SEPARATOR_|`) // Insert text separator into Html
preCleanNode := s.Find("div").Contents().Not(".label").Text() //Get Html as Text
cleanNode := strings.Split(preCleanNode, `|_SEPARATOR_|`) // Split text based on Text Separator
outputString := cleanNode[0] // Output our wanted text

关于html - GoLang - GoQuery HTML 插入失败,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42142333/

31 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com