gpt4 book ai didi

ruby - 将 HTML 转换为纯文本(包含
s)

转载 作者:数据小太阳 更新时间:2023-10-29 06:45:21 26 4
gpt4 key购买 nike

是否可以使用 Nokogiri 将 HTML 转换为纯文本?我还想包括 <br />标签。

例如,给定这个 HTML:

<p>ala ma kota</p> <br /> <span>i kot to idiota </span>

我想要这个输出:

ala ma kota
i kot to idiota

当我调用 Nokogiri::HTML(my_html).text它不包括 <br />标签:

ala ma kota i kot to idiota

最佳答案

我没有编写复杂的正则表达式,而是使用了 Nokogiri。

工作解决方案(K.I.S.S!):

def strip_html(str)
document = Nokogiri::HTML.parse(str)
document.css("br").each { |node| node.replace("\n") }
document.text
end

关于ruby - 将 HTML 转换为纯文本(包含 <br>s),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10144739/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com