gpt4 book ai didi

php - 在 XML DOM (PHP) 中获取段落

转载 作者:行者123 更新时间:2023-12-04 05:25:02 24 4
gpt4 key购买 nike

我正在尝试从 boomkat.com RSS 提要创建新版本的数据库。 Feed 位于此处:
link

现在,我在选择段落标签内的内容时遇到了问题。

RSS 提要中的一段如下所示:

<p>GOAT<br/><a href="http://boomkat.com/downloads/601228-goat-world-music">World Music</a><br/>ROCKET RECORDINGS<br/>INDIE / ROCK / ALTERNATIVE<br/>MP3 Release</p>

到目前为止我所做的是:
<?php

$dom = new DOMDocument;
$dom->validateOnParse = true;
$dom->load("http://feeds.boomkat.com/boomkat_downloads_just_arrived");
$content = $dom->getElementsByTagName('content');
foreach ($content as $result) {
echo $result->nodeValue, PHP_EOL;
}
?>

但这给了我完整的饲料。在 getElementsByTagName 中写入“p”不起作用。

最佳答案

我建议使用 DOMDocument::loadHTMLFile() 方法而不是 DOMDocument::load() (因为 load() 严格用于读取 XML,而不是 HTML)。

您获取整个文档的原因是因为您正在查询整个文档以查找名为“内容”的元素。没有这样的 HTML 元素。相反,你应该使用

$dom->getElementsByTagName('p');

这将抓取 HTML 文档中的所有标签,然后您可以遍历它。使用“p”查询标签不起作用的主要原因是因为您需要将文档加载为严格的 HTML,而不是使用默认的 XML。

关于php - 在 XML DOM (PHP) 中获取段落,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13291250/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com