gpt4 book ai didi

php - Xpath如何从子级获取文本内容(除某些标签外)

转载 作者:行者123 更新时间:2023-12-03 17:37:29 26 4
gpt4 key购买 nike

我想通过Xpath从此html代码中获取文本1和文本2。



<div id="detailInfo" class="">
<h3 class=""><img src="/program/image/abc.gif" alt="ddd" width="92" height="23"></h3>

<p class=""><a href="http://link.html" target="_blank"><img alt="qvc_b.jpg" src="/image.jpg" width="300" height="50"></a></p>

<p class="">text 1<br>
text 2</p>

<p class=""><a href="http://link2.html">>text 3</a></p>

<p class=""> <span style="color:#00a7ac; font-size:12px"><br>
------------------------------------------------------------------<br>
text 4<br>
text 5
------------------------------------------------------------------</span>
<span><br>
------------------------------------------------------------------<br>
text 6
------------------------------------------------------------------</span></p>
<!-- /detailInfo -->
</div>





条件是直接从div的p个子元素获取所有文本内容,而不从“ a”和“ span”标签获取文本

最佳答案

在这种情况下,您可以将text()normalize-space一起使用,以免空白出现:

$dom = new DOMDocument();
$dom->loadHTML($html_string);
$xpath = new DOMXpath($dom);

$elements = $xpath->query("//div/p/text()[normalize-space()]");
foreach($elements as $e) {
echo $e->nodeValue . '<br/>';
}

关于php - Xpath如何从子级获取文本内容(除某些标签外),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25907643/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com