gpt4 book ai didi

python - 如何使用 Python 从 HTML 文档中提取信息?

转载 作者:行者123 更新时间:2023-12-01 05:01:22 25 4
gpt4 key购买 nike

我需要 python 从 HTML 文件中提取一些数据。

我目前使用的代码如下:

import urllib
recent = urllib.urlopen(http://gamebattles.majorleaguegaming.com/ps4/call-of-duty-ghosts/team/TeamCrYpToNGamingEU/match?id=46057240)
recentsource = recent.read()

我现在需要它来打印其他团队该网页表格中的玩家标签列表。

我该怎么做?

谢谢

最佳答案

看看Beautiful Soup模块,这是一个很棒的文本解析器。

如果您不想安装或无法安装,可以下载源代码,并将.py文件放在与您的程序相同的目录中。

为此,请从网站下载并提取代码,然后将“bs4”目录复制到与 Python 脚本相同的文件夹中。

然后,将其放在代码的开头:

from bs4 import BeautifulSoup
# or
from bs4 import BeautifulSoup as bs
# To type bs instead of BeautifulSoup every single time you use it

您可以从其他 stackoverflow 问题中了解如何使用它,或者查看 documentation

关于python - 如何使用 Python 从 HTML 文档中提取信息?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26080939/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com