gpt4 book ai didi

ruby - 从网页读取链接的 href 时, Mechanize 将 `~` 替换为 `‾`

转载 作者:行者123 更新时间:2023-12-04 16:22:07 25 4
gpt4 key购买 nike

我正在使用 Mechanize用于抓取 epinions.com 的一些内容的 Ruby gem。但不知何故,有些链接没有被正确解释。这是由 Mechanize 更换 ~ 引起的与 .结果是 Mechanize 无法单击该链接。

一个不成功的例子,然后一个成功的抓取:

# script

agent = Mechanize.new

page_1 = agent.get("http://www.epinions.com/webs-Web_Services-All-Merchants-AtomicPark_com/display_~reviews")
puts page_1.links_with(:href => /full_specs/, :text => /^View Information$/).last.inspect

page_2 = agent.get("http://www.epinions.com/webs-Web_Services-All-Merchants-Vanns_com/display_~reviews")
puts page_2.links_with(:href => /full_specs/, :text => /^View Information$/).last.inspect

# result

#<Mechanize::Page::Link
"View Information"
"/webs-Web_Services-All-Merchants-AtomicPark_com/display_‾full_specs">
#<Mechanize::Page::Link
"View Information"
"/webs-Web_Services-All-Merchants-Vanns_com/display_~full_specs">

知道为什么会这样吗?

最佳答案

这对我来说很好用:

[14:29] arkham ~/Desktop [2.1.0]
↳ $ ruby mechanize.rb
#<Mechanize::Page::Link
"View Information"
"/webs-Web_Services-All-Merchants-AtomicPark_com/display_~full_specs">
#<Mechanize::Page::Link
"View Information"
"/webs-Web_Services-All-Merchants-Vanns_com/display_~full_specs">

您使用的是哪个版本的 ruby​​?

关于ruby - 从网页读取链接的 href 时, Mechanize 将 `~` 替换为 `‾`,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21074269/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com