gpt4 book ai didi

ruby - 抓取网页时如何提取 html 转义字符/实体作为文本? ( ruby 和 nokogiri)

转载 作者:太空宇宙 更新时间:2023-11-03 16:39:32 25 4
gpt4 key购买 nike

在我的 ruby​​+mechanize(nokogiri) 脚本中,我使用了这段代码:

row.at_xpath('td[3]/div[1]/a/text()').to_s.strip

在帖子标题 html 看起来像这样的论坛上:

<a href="showthread.php?t=233891" >&lt;/body&gt; on Footer ?</a>

我从 xpath 收到这个字符串 &lt;/body&gt; on Footer ?

我想获得我可以在网络浏览器中看到的内容 </body> on Footer ?

如何为所有 html 转义字符/实体执行此操作?

最佳答案

请看this post , 转义 htmlentities

有一个名为htmlentities 的ruby 包

关于ruby - 抓取网页时如何提取 html 转义字符/实体作为文本? ( ruby 和 nokogiri),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2122118/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com