gpt4 book ai didi

html - 在 Nokogiri 中禁用纠错

转载 作者:数据小太阳 更新时间:2023-10-29 08:05:49 24 4
gpt4 key购买 nike

我正在处理许多格式错误的 HTML 页面。至少,我认为它们格式不正确,因为当我在 Nokogiri 中解析它们然后执行 to_html 时,元素不再正确显示。但是,当我使用 Hpricot 解析它们时,它们会正确显示。

我宁愿不使用 Hpricot,因为似乎不可能将 Hpricot::Elem 实例添加到文档中(不将它们转换为字符串,添加,然后再次解析)。

我可以禁用 Nokogiri 的纠错,以便我可以保留更接近其编写方式的 HTML 吗?

最佳答案

您的 XHTML 不是有效的 XHTML。如果我从 http://pastie.org/2638305 复制内容,将它们保存为“foo.xhtml”,然后尝试在 Chrome 中打开它们,我看到:

This page contains the following errors:
error on line 768 at column 39: attributes construct error

如果我查看第 768 行,则会看到(截断):

<img src="..." alt="Talk to us now!"http://wholesaleinsurance.net/>

如您所见,这显然在语法上是无效的。

您声称您通过 validator.w3.org 运行该页面,但是当我使用您的 pastie 内容执行此操作时,我得到:

Errors found while checking this document as XHTML 1.0 Strict!
Result: 15 Errors, 3 warning(s)

那么...您的实际内容不是您放入馅饼中的内容吗?

关于html - 在 Nokogiri 中禁用纠错,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7637882/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com