gpt4 book ai didi

python - 从用 python 读取的网页中读取一些内容

转载 作者:太空宇宙 更新时间:2023-11-03 12:28:55 24 4
gpt4 key购买 nike

我正在尝试从 web 的 python 模块中读取一些数据。

我设法阅读,但在解析这些数据和获取所需信息时遇到一些困难。

我的代码如下。感谢您的帮助。

#!/usr/bin/python2.7 -tt

import urllib
import urllib2

def Connect2Web():
aResp = urllib2.urlopen("https://uniservices1.uobgroup.com/secure/online_rates/gold_and_silver_prices.jsp");
web_pg = aResp.read();

print web_pg

#Define a main() function that prints a litte greeting
def main():
Connect2Web()

# This is the standard boilerplate that calls the maun function.
if __name__ == '__main__':
main()

当我打印这个 web page我打印了整个网页。

我想从中提取一些信息(例如 "SILVER PASSBOOK ACCOUNT" 并从中获取汇率),我在解析此 html 文档时遇到了一些困难。

最佳答案

不推荐使用RE来匹配XML/HTML。但是,它有时可以工作。最好使用 HTML 解析器和 DOM API。这是一个例子:

import html5lib
import urllib2

aResp = urllib2.urlopen("https://uniservices1.uobgroup.com/secure/online_rates/gold_and_silver_prices.jsp")
t = aResp.read()
dom = html5lib.parse(t, treebuilder="dom")
trlist = dom.getElementsByTagName("tr")
print trlist[-3].childNodes[1].firstChild.childNodes[0].nodeValue

您可以遍历 trlist 来查找您感兴趣的数据。

添加自评论: html5lib 是第三方模块。参见 html5lib site . easy_installpip 程序应该能够安装它。

关于python - 从用 python 读取的网页中读取一些内容,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10061544/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com