javascript - 为什么 DOMParser 会改变空格？-6ren

javascript - 为什么 DOMParser 会改变空格？

转载作者：行者123 更新时间：2023-11-28 00:33:58

26

4

为什么以下 DOMParser 的使用导致 HTML 与用作输入的 HTML 不同？它删除了 DOCTYPE 和顶级元素之间的空格，删除了文档元素和 head 之间的空格。 , 并在 </body> 之前添加换行符.

我已经在 Google Chrome、Firefox 和 Safari 中对此进行了测试；我还使用 JSoup 运行了类似的代码并得到完全相同的结果。所以我很确定这不是一个错误。我目前的理论是，这是由某处规范中的某种深奥的解析规则引起的。但可能还有其他我误解的事情。

const html = `<!DOCTYPE html>
<html>
  <head>
    <title>1</title>
  </head>
  <body>
    <div>
      Hello, World!
    </div>
  </body>
</html>`;

const setText = function(id,string) {
  document.getElementById(id).appendChild(document.createTextNode(string));
};

const documentToString = function(d) {
  return Array.prototype.slice.call(d.childNodes).map(function(node) {
    if (node.nodeType == node.ELEMENT_NODE) return node.outerHTML;
    if (node.nodeType == node.DOCUMENT_TYPE_NODE) return new XMLSerializer().serializeToString(node);
    throw new TypeError("" + node);
  }).join("");
};

setText("raw", html);
var parsed = new DOMParser().parseFromString(html,"text/html");
setText("parsed", parsed.documentElement.outerHTML);
setText("converted", documentToString(parsed));
setText("xmlserializer", new XMLSerializer().serializeToString(parsed));

#raw, #parsed, #converted, #xmlserializer { white-space: pre; font-family: monospace; }
h1 { font-size: 110%; font-weight: bold; font-family: sans-serif; }

<body>
<h1>Raw string</h1>
<div id="raw"></div>
<h1>Parsed top-level element</h1>
<div id="parsed"></div>
<h1>Using a document-to-string converter</h1>
<div id="converted"></div>
<h1>From XMLSerializer</h1>
<div id="xmlserializer"></div>
</body>

最佳答案

因为那是the specs要求做。

HTML 不是 XML，会发生很多转换。例如，您可能没有意识到，您的 StackSnippet 包含重复的 <body>标签，因为 HTML 部分实际上被片段的脚本包裹在这样的标签中。文档解析时忽略重复项。

console.log('how many bodies?', document.querySelectorAll('body').length);

<body><body><body></body></body></body>

类似的转换发生在 TextNode 上。

是的，它不是 DOMParser事情，它实际上是一个 HTML DOM 解析器，您在文档解析时具有相同的行为:

frame.src = URL.createObjectURL(new Blob([
`<!DOCTYPE html>
<html>
  <head>
    <title>1</title>
  </head>
  <body>
    <div>
      Hello, World!
    </div>
    <script>      parent.postMessage(document.documentElement.outerHTML, "*");
    <\/script>
  </body>
</html>`], {type: 'text/html'}));

onmessage = e => console.log(e.data);

<iframe id="frame"></iframe>

现在，如果您希望检索完全相同的字符串，则改为将其解析为 XML:

const html = `<!DOCTYPE html>
<html>
  <head>
    <title>1</title>
  </head>
  <body>
    <div>
      Hello, World!
    </div>
  </body>
</html>`;

const setText = function(id,string) {
  document.getElementById(id).appendChild(document.createTextNode(string));
};

const documentToString = function(d) {
  return Array.prototype.slice.call(d.childNodes).map(function(node) {
    if (node.nodeType == node.ELEMENT_NODE) return node.outerHTML;
    if (node.nodeType == node.DOCUMENT_TYPE_NODE) return new XMLSerializer().serializeToString(node);
    throw new TypeError("" + node);
  }).join("");
};

setText("raw", html);
var parsed = new DOMParser().parseFromString(html,"text/xml");
setText("parsed", parsed.documentElement.outerHTML);
setText("converted", documentToString(parsed));
setText("xmlserializer", new XMLSerializer().serializeToString(parsed));

#raw, #parsed, #converted, #xmlserializer { white-space: pre; font-family: monospace; }
h1 { font-size: 110%; font-weight: bold; font-family: sans-serif; }

<h1>Raw string</h1>
<div id="raw"></div>
<h1>Parsed top-level element</h1>
<div id="parsed"></div>
<h1>Using a document-to-string converter</h1>
<div id="converted"></div>
<h1>From XMLSerializer</h1>
<div id="xmlserializer"></div>

关于javascript - 为什么 DOMParser 会改变空格？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/57394776/

26

4

0

文章推荐： css - 在产品编辑标签云上隐藏某些标签

文章推荐： html - CSS 方向(横向|纵向)未按预期工作

文章推荐： javascript - 如何读取复选框和单选按钮的值

文章推荐： javascript - 如何动态添加代码笔嵌入并确保它被渲染？

Julia 变量消失/改变
我有以下MWE function f(p) ans = zeros(p, 2) return ans end ans = f(2) ans b=ans.+1.0 ans 起初，ans是正确的，
OWIN 改变 UseStatic？
OWIN AppBuilder“UseStatic”位从本地文件系统传送文件，这在某些情况下很方便，但我希望它从我在应用程序启动时预先填充的内存中 IDictionary 传送内容。任何人都可以指出一
Javascript 改变 Typeof
我是 JavaScript 新手。我的代码允许我列出 JSON 文档的元素及其类型，并将所有元素连接到一个字符串 donnees_types 中。问题是 JavaScript 中的 typeof
javascript - 背景图像 - 改变
我想在每次刷新时更改主页上的背景图像。我怎样才能做到这一点？我认为 jquery 是可能的，但我不太清楚。感谢您对此主题的任何帮助或评论。最佳答案我不知道“如何”，但我找到了以下链接: http
java - for循环中的除数值正在神秘地(？)改变
所以我已经在这上面花了几个小时了，老实说我完全陷入困境。我写了一个 for 循环来计算整数中的数字数量，但我发现一旦我输入 10 位以上的数字，除数值就会发生变化，而且我不明白为什么。我在互联网上搜索
java - 改变 Activity
当我在使用表面 View 的游戏 Activity 和使用膨胀菜单的其他 Activity 之间切换时，我会收到错误消息。日志猫: 07-13 15:15:34.464: ERROR/Android
改变 RGB 颜色的亮度
听说很简单 R*=f; G*=f; B*=f; 其中 f 是标量值 0 .. 1.0 或更大改变亮度的方法不太正确颜色，但我找不到一些代码片段获得更好的东西(无需太多学习色彩理论)也许有人可以在这里给
java - 改变 ThreadPoolExecutor
如以下链接所述:- How to get the ThreadPoolExecutor to increase threads to max before queueing? 我将队列实现更改为在进入
javascript - 改变 slotMinutes
我只显示最初提供 20 分钟 slotMinutes 的日历。我试图让用户即时更改为 10 分钟的 slotMinutes。我有一个触发以下代码的按钮: $('#calendar').fullCal
ios - 改变 UIViewController
我的问题是:我的应用程序中有一个新闻列表(UITableView)当我点击 1 个"new"时，我打开它，里面有一个后退按钮，可以让我回到列表。现在的问题是我必须在滑动时实现"new"更改，所以我制作
postgresql - 改变 pg_config
我面临着与 I'm trying to install psycopg2 onto Mac OS 10.6.3; it claims it can't find "stdarg.h" but I ca
javascript - 改变。通过基于索引数组进行过滤来显示数组中的可见属性
需要通过为 array2 中不存在的索引设置 visible false 来从 array1 创建一个新的 array3。在下面的示例中，我有索引 0,2。所以对于 1,3，结果数组必须具有 vis
JavaScript 改变 this 的所有权
我有一个对象，类似这样 var Egg = function(){ this.test = $(.slider .label); $('.slider').slider({
swift - 改变 NSLayoutConstraint
我想改变 ScrollView 的宽度。首先，我这样做了: var scrollWidthConstraint: NSLayoutConstraint! 然后设置它: scrollWidthConst
javascript动画后不透明度有时会(随机)改变
我有两个动画，一个是“过渡”，它在悬停时缩小图像，另一个是 animation2，其中图像的不透明度以周期性间隔重复变化。我有 animation2 在图像上进行，当我将鼠标悬停在它上面时，anim
jQuery 改变 id!
我是一个 jQuery 新手，一直在尝试添加一个脚本来更改 div onClick 的 id。这是一个jsfiddle example . $(function accept() { $("
改变 C 中字母的大小写？
我正在尝试更改用户输入的字母的大小写，并将该字母的小写和大写版本存储在变量中。我已经编写了下面的代码，但它在运行时遇到了问题。有人指出是什么导致了问题吗？ #include #include #i
改变 char* 指向几位偏移量
假设我有这段代码: char num[2] = {15, 240}; char* p_num; 现在，如果我理解的一切正确，数组中的位应该像这样对齐: 00001111 11110000 我的问题是
JavaScript 改变 css
var html = '' + count + '' + i.Description + '' + i.Priority + '' + i.Status + 'johnsmith- ' + creat
改变 Minix3 的优先级队列
我在虚拟机上安装了 minix3，并希望我可以操纵当前的队列选择算法，以便我可以将其从优先级顺序更改为包括随机分类的低优先级作业的优先级顺序。我发现我需要更改的代码部分在 proc.c 中，具体部分是

首页

博学

6Ren·AI

商城

javascript - 为什么 DOMParser 会改变空格？