gpt4 book ai didi

html - Ruby Mechanize - 如何在 Mechanize 解析站点响​​应之前解析它?

转载 作者:行者123 更新时间:2023-12-04 16:20:28 26 4
gpt4 key购买 nike

问题:

解析网站时,有些字符会导致 Mechanize 无法正确解析。

提出的解决方案

  • 解析来自网站的响应以删除这些字符
    在 Mechanize 之前尝试解析它。
  • 或者,在 Mechanize 解析网络后删除这些字符,然后让 Mechanize 重新解析它以获取链接、表单等...

  • 问题
  • 如何在解析之前访问网站响应?
  • 或者,我怎样才能在之后解析它,然后让 Mechanize 重新加载它?

  • 谢谢!

    最佳答案

    好的,我找到了解决方案:
    您可以定义自己的 html 解析器,使其充当钩子(Hook)。

    class MyParser
    def self.parse(thing, url = nil, encoding = nil, options = Nokogiri::XML::ParseOptions::DEFAULT_HTML, &block)
    thing = thing.gsub(/\x00/,"")
    Nokogiri::HTML::Document.parse(thing, url, encoding, options, &block)
    end
    end
    agent.html_parser = MyParser
    search_page = agent.get "https://www.example.com"

    关于html - Ruby Mechanize - 如何在 Mechanize 解析站点响​​应之前解析它?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29649213/

    26 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com