gpt4 book ai didi

php - DOMCrawler 纯文本

转载 作者:行者123 更新时间:2023-11-28 01:26:24 24 4
gpt4 key购买 nike

我正在使用 Symfony 的 DomCrawler 从网站获取信息。
在其中一个页面中有一段文本包含非 html 编码的属性,如下所示:

<a href="some-url.html">Lorem ipsum <<dolor sit>> amet </a>

当我尝试使用 filterXPath 从 a 标签中抓取文本时我得到的方法 Lorem ipsum < ,因为我认为它对符号的行为类似于损坏的 html 标签,而只是忽略它们。

此外,当我尝试使用 $node->filterXPath('my-xpath/a')->html() 时,我也像下面的例子一样损坏了 html:

<a href="some-url.html">Lorem ipsum &gt;</a>

那么,我的问题是是否有任何方法可以从节点中获取“纯”文本?

最佳答案

我认为你正在寻找的东西可以通过使用来完成:

$node->filterXPath('my-xpath/a')->text();

您可以在 Symfony DOM Crawler documentation site 上找到文档.

关于php - DOMCrawler 纯文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31927748/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com