gpt4 book ai didi

html - 如何使用 Nokogiri 用

标签包装 HTML 无标签文本?

转载 作者:数据小太阳 更新时间:2023-10-29 02:05:25 26 4
gpt4 key购买 nike

我必须将 HTML 文档解析为不同的新文件。问题是有些文本节点没有用 "<p>" 包裹标签,而不是他们有 "<br>"每个段落末尾的标签。

我想用 <p> 包装这段文字使用 Nokogiri 的标签:

<div id="f15"><b>Footnote 15</b>: Catullus iii, 12.</div>
<div class="pgmonospaced pgheader"><br/>
<br/>
End of the Project abc<br/>
<br/>
*** END OF THIS PROJECT XYZ ***<br/>
<br/>
***** This file should be named new file.html... *****<br/>
<br/></div>

最佳答案

在搜索一些论坛并在本地进行一些调试后,我找到了以下解决问题的方法。

html_doc = Nokogiri::HTML.parse('path/to/html_file')
html_doc
html_doc.search("//br/preceding-sibling::text()|//br/following-sibling::text()").each do |node|
node.replace(Nokogiri.make("<p>#{node.to_html}</p>"))
end

关于html - 如何使用 Nokogiri 用 <p> 标签包装 HTML 无标签文本?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8937846/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com