gpt4 book ai didi

php - 使用 XMLReader 解析媒体 RSS

转载 作者:数据小太阳 更新时间:2023-10-29 02:59:51 25 4
gpt4 key购买 nike

<rss version="2.0"
xmlns:media="http://search.yahoo.com/mrss/">
<channel>
<title>Title of RSS feed</title>
<link>http://www.google.com</link>
<description>Details about the feed</description>
<pubDate>Mon, 24 Nov 08 21:44:21 -0500</pubDate>
<language>en</language>
<item>
<title>Article 1</title>
<description><![CDATA[How to use StackOverflow.com]]></description>
<link>http://youtube.com/?v=y6_-cLWwEU0</link>
<media:player url="http://youtube.com/?v=y6_-cLWwEU0" />
<media:thumbnail url="http://img.youtube.com/vi/y6_-cLWwEU0/default.jpg"
width="120" height="90" />
<media:title>Jared on StackOverflow</media:title>
<media:category label="Tags">tag1,tag2</media:category>
<media:credit>Jared</media:credit>
<enclosure url="http://youtube.com/v/y6_-cLWwEU0.swf"
length="233"
type="application/x-shockwave-flash"/>
</item>
</channel>
</rss>

我决定使用 XMLReader 来解析我的大型 xml 文件。我无法获取每个项目中的数据,尤其是缩略图

这是我的代码

//////////////////////////////

$itemList = array();
$i=0;
$xmlReader = new XMLReader();
$xmlReader->open('XMLFILE');
while($xmlReader->read()) {
if($xmlReader->nodeType == XMLReader::ELEMENT) {
if($xmlReader->localName == 'title') {
$xmlReader->read();
$itemList[$i]['title'] = $xmlReader->value;
}
if($xmlReader->localName == 'description') {
// move to its textnode / child
$xmlReader->read();
$itemList[$i]['description'] = $xmlReader->value;

}
if($xmlReader->localName == 'media:thumbnail') {
// move to its textnode / child
$xmlReader->read();
$itemList[$i]['media:thumbnail'] = $xmlReader->value;
$i++;
}
}
}
////////////////

由于我正在解析巨大的 XML 文件,是否建议使用 DOMXpath?非常感谢您的建议。

最佳答案

小田,

如果您关心内存使用情况,我建议您远离 DOM/XPath,因为它要求首先将整个文件读入内存。 XMLReader 一次只读取一个 block (可能是 8K,因为这似乎是标准的 PHP block 大小)。

我重写了您最初发布的内容,它捕获了 <item> 中包含的以下元素元素:

  1. title
  2. description
  3. media:thumbnail
  4. media:title

你必须记住的是 XMLReader::localName将返回元素名称减去任何 XMLNS 声明(例如 media:thumbnaillocalNamethumbnail )。你会想要小心这个作为 media:title值可以覆盖 title值(value)。

这是我重写的内容:

<?php
define ('XMLFILE', dirname(__FILE__) . '/Rss.xml');
echo "<pre>";

$items = array ();
$i = 0;

$xmlReader = new XMLReader();
$xmlReader->open (XMLFILE, null, LIBXML_NOBLANKS);

$isParserActive = false;
$simpleNodeTypes = array ("title", "description", "media:title");

while ($xmlReader->read ())
{
$nodeType = $xmlReader->nodeType;

// Only deal with Beginning/Ending Tags
if ($nodeType != XMLReader::ELEMENT && $nodeType != XMLReader::END_ELEMENT)
{
continue;
}
else if ($xmlReader->name == "item")
{
if (($nodeType == XMLReader::END_ELEMENT) && $isParserActive)
{
$i++;
}
$isParserActive = ($nodeType != XMLReader::END_ELEMENT);
}

if (!$isParserActive || $nodeType == XMLReader::END_ELEMENT)
{
continue;
}

$name = $xmlReader->name;

if (in_array ($name, $simpleNodeTypes))
{
// Skip to the text node
$xmlReader->read ();
$items[$i][$name] = $xmlReader->value;
}
else if ($name == "media:thumbnail")
{
$items[$i]['media:thumbnail'] = array (
"url" => $xmlReader->getAttribute("url"),
"width" => $xmlReader->getAttribute("width"),
"height" => $xmlReader->getAttribute("height")
);
}
}

var_dump ($items);

echo "</pre>";

?>

如果您对它的工作原理有任何疑问,我很乐意为您解答。

关于php - 使用 XMLReader 解析媒体 RSS,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/925300/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com