gpt4 book ai didi

html - 使用嵌入的 < 和 > 进行解析

转载 作者:太空宇宙 更新时间:2023-11-03 16:23:56 25 4
gpt4 key购买 nike

我有一个 HTML 内容,其中包含类似 < 的 HTML 实体, > , %在 HTML 标签中。

html_text = '<td class="web" width="56" valign="middle" style="color:#333333; font-family:Arial, Helvetica, sans-serif; font-size:12px; line-height:18px; padding-top:38px; padding-bottom:40px;"><img alt="<%= ab("###/a/j/img1_alt_text=Hey") %>" src="<%%= @dropbox_path %>/path/to/image/image.png" width="42" height="41" border="0" hspace="0" vspace="0" style="display:block; vertical-align:top;">String1</td>'

当我用这个 HTML 内容(字符串)制作 HTML 文档时使用

html_doc = Nokogiri::HTML(html_text,nil, "UTF-8")

然后我尝试遍历它要求给我一个文本节点,

html_doc.traverse 做|x|

x.text?

temp = x.content

放温度

我其实想要这里'String1'作为输出,但它给了我:

" src="/path/to/image/image.png" width="42" height="41" border="0" hspace="0" vspace="0" style="display:block; vertical-align:top;">

最佳答案

尝试:

page.css('td')[0].text

有关详细信息,请参阅“Parsing HTML with Nokogiri”。

关于html - 使用嵌入的 < 和 > 进行解析,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28693717/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com