gpt4 book ai didi

ruby - Mechanize 获取文件而不是页面对象

转载 作者:行者123 更新时间:2023-12-04 16:19:34 27 4
gpt4 key购买 nike

我试图废弃一个网页。我使用Nokogiri/Mechanize 。所以如果我做

page = agent.get(url)
page.class
=> Mechanize::File

,有时我会得到一个页面对象,有时是一个文件对象。但我需要的是,每次都有一个页面对象。我试图为纯文本/文本添加一个 pluggable_parser 但这对我不起作用。

有没有人知道如何修复它,或者如何从文件对象中找出内容类型,或者知道如何将文件转换为页面对象?

谢谢迈克尔

最佳答案

您请求的页面很可能不可用,并且服务器返回纯文本错误页面。

请参阅 Mechanize::File 上的文档.

内容类型在 page.response['content-type'] .

绝对可以更改响应的内容类型,然后创建一个 Mechanize::Page从数据中无需再次下载 - 但我认为这不会给你任何有用的东西。

检查响应代码,它在 page.code .

关于ruby - Mechanize 获取文件而不是页面对象,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7555035/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com