gpt4 book ai didi

python - 为什么从站点检索到的 xml 看起来不像 Web 浏览器内容?

转载 作者:可可西里 更新时间:2023-11-01 16:25:14 28 4
gpt4 key购买 nike

我一直在尝试获取在此处找到的 xml 数据:http://www.thetvdb.com/api/D1BD82E2AE599ADD/mirrors.xml

您会注意到 xml 数据很容易在您的网络浏览器中读取。但是,当我尝试使用 urllib2 加载它时,会出现以下问题。 (基于在 http://www.doughellmann.com/PyMOTW/urllib2/ 找到的教程):

import urllib2
response = urllib2.urlopen('http://www.thetvdb.com/api/D1BD82E2AE599ADD/mirrors.xml')

print response.read()

输出:

'<?xml version="1.0" encoding="UTF-8" ?>\n<Mirrors>\n  <Mirror>\n    <id>1</id>\n    <mirrorpath>http://thetvdb.com</mirrorpath>\n    <typemask>7</typemask>\n  </Mirror>\n</Mirrors>\n'

我尝试过其他网站(例如:python.org),它似乎有效。该问题似乎与库无关(我在 urllib、httplib、httplib2 等方面遇到了同样的问题),而且该问题似乎特定于我尝试获取的站点。

什么给了?

编辑:好吧,我似乎对我“应该”看到的东西感到困惑。出于好奇,有人知道“脚本”部分是什么吗?我正在使用谷歌浏览器(稳定版)查看页面。

最佳答案

“它看起来与在网络浏览器中加载页面时显示的数据完全不同。我正在使用此信息更新问题..”

当我通过 Chrome 获取该示例 URL 时,我得到的正是您通过 Python 代码获取的内容,即原始数据

您的浏览器自动神奇地检测 XML 并将其格式化为 HTML。它与 Python 得到的“完全相同”,即原始数据。浏览器让您对您应该期待的感到困惑。

注意:不要相信您通过开发人员工具信息看到或报告的内容,它向您显示的是 HTML在这种情况下,Chrome 神奇地生成了一个围绕输出的生成包装器,以启用带有代码折叠 (JavaScript) 的 XML 和所有其他 bling 的交互式显示,而不是服务器实际发送给您的内容,这是您应该看到的内容您使用查看源代码

关于python - 为什么从站点检索到的 xml 看起来不像 Web 浏览器内容?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9669681/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com