gpt4 book ai didi

php - 解析带有格式化文本的 HTML

转载 作者:搜寻专家 更新时间:2023-10-31 21:26:04 29 4
gpt4 key购买 nike

我正在使用 DOMDocument 解析 HTML 网页。

这是我的代码:

$doc = new DOMDocument();
$doc->strictErrorChecking = false;
$input = file_get_contents($url); //Url passato come parametro
$doc->loadHTML( $input );
$xpath = new DOMXpath($doc);
$article = $xpath->query('//div[@class="entry-container fix"]');

在 $article 中,我将所有文本都放在“entry-container fix”Div 中。

但是网页中的这个文本有一个格式化的文本。简单举例:

<div> 
<p> Text <strong> Strong text </strong> </p>
</div>

在我的代码中,我丢失了所有粗体、意大利字符、所有段落 ecc...有没有办法获取所有格式化的文本?

最佳答案

为什么不使用 saveHTML 函数来提取该 HTML(这里是链接:http://php.net/manual/fr/domdocument.savehtml.php)。它看起来像这样:

$sFormated = $doc->saveHTML($article->item(0));

关于php - 解析带有格式化文本的 HTML,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35922738/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com