gpt4 book ai didi

php - 使用 PHP 的 DomDocument appendChild 时保留换行符

转载 作者:行者123 更新时间:2023-12-04 06:10:31 26 4
gpt4 key购买 nike

我正在尝试使用 PHP 中的 DOMDocument 在 HTML 文档中添加/解析内容。从我所读到的,将 formOutput 设置为 true 并将 preserveWhiteSpace 设置为 false 应该使制表符和换行符保持有序,但它似乎不适用于新创建或附加的节点。

这是代码:

$dom = new \DOMDocument;
$dom->formatOutput = true;
$dom->preserveWhiteSpace = false;
$dom->loadHTMLFile($htmlsource);
$tables = $dom->getElementsByTagName('table');
foreach($tables as $table)
{
$table->setAttribute('class', 'tborder');
$div = $dom->createElement('div');
$div->setAttribute('class', 'm2x');
$table->parentNode->insertBefore($div, $table);
$div->appendChild($table);
}
$dom->saveHTMLFile($html)

这是 HTML 的样子:
<table>
<tr>
<td></td>
</tr>
</table>

这是我想要的:
<div class="m2x">
<table class="tborder">
<tr>
<td></td>
</tr>
</table>
</div>

这是我得到的:
<div class="m2x"><table class="tborder"><tr>
<td></td>
</tr></table></div>

有什么我做错了吗?我已经尝试在谷歌上搜索尽可能多的不同方式,但没有运气。

最佳答案

不幸的是,您可能需要编写一个函数来按照您希望的方式缩进输出。我做了一个你可能会觉得有用的小功能。

function indentContent($content, $tab="\t")
{

// add marker linefeeds to aid the pretty-tokeniser (adds a linefeed between all tag-end boundaries)
$content = preg_replace('/(>)(<)(\/*)/', "$1\n$2$3", $content);

// now indent the tags
$token = strtok($content, "\n");
$result = ''; // holds formatted version as it is built
$pad = 0; // initial indent
$matches = array(); // returns from preg_matches()

// scan each line and adjust indent based on opening/closing tags
while ($token !== false)
{
$token = trim($token);
// test for the various tag states

// 1. open and closing tags on same line - no change
if (preg_match('/.+<\/\w[^>]*>$/', $token, $matches)) $indent=0;
// 2. closing tag - outdent now
elseif (preg_match('/^<\/\w/', $token, $matches))
{
$pad--;
if($indent>0) $indent=0;
}
// 3. opening tag - don't pad this one, only subsequent tags
elseif (preg_match('/^<\w[^>]*[^\/]>.*$/', $token, $matches)) $indent=1;
// 4. no indentation needed
else $indent = 0;

// pad the line with the required number of leading spaces
$line = str_pad($token, strlen($token)+$pad, $tab, STR_PAD_LEFT);
$result .= $line."\n"; // add to the cumulative result, with linefeed
$token = strtok("\n"); // get the next token
$pad += $indent; // update the pad size for subsequent lines
}

return $result;
}
indentContent($dom->saveHTML())将返回:
<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN" "http://www.w3.org/TR/REC-html40/loose.dtd">
<html>
<body>
<div class="m2x">
<table class="tborder">
<tr>
<td>
</td>
</tr>
</table>
</div>
</body>
</html>

我从 this one 开始创建了这个函数.

关于php - 使用 PHP 的 DomDocument appendChild 时保留换行符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7838929/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com