gpt4 book ai didi

ruby - 使用 Nokogiri 获取 HTML 结构

转载 作者:数据小太阳 更新时间:2023-10-29 08:33:53 25 4
gpt4 key购买 nike

我的任务是在没有数据的情况下获取文档的 HTML 结构。来自:

<html>
<head>
<title>Hello!</title>
</head>
<body id="uniq">
<h1>Hello World!</h1>
</body>
</html>

我想得到:

<html>
<head>
<title></title>
</head>
<body id="uniq">
<h1></h1>
</body>
</html>

有很多方法可以使用 Nokogiri 提取数据,但我找不到执行反向任务的方法。

更新:找到的解决方案是我收到的两个答案的组合:

doc = Nokogiri::HTML(open("test.html"))
doc.at_css("html").traverse do |node|
if node.text?
node.remove
end
end
puts doc

输出正是我想要的。

最佳答案

听起来您想删除所有文本节点。你可以这样做:

doc.xpath('//text()').remove
puts doc

关于ruby - 使用 Nokogiri 获取 HTML 结构,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8206989/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com