gpt4 book ai didi

python - 在python中获取html标签值

转载 作者:搜寻专家 更新时间:2023-10-31 22:46:04 24 4
gpt4 key购买 nike

我是 python 的新手。这是我在 python 2.7.5 上运行的代码

import urllib2
import sys

url ="mydomain.com"
usock = urllib2.urlopen(url)
data = usock.read()
usock.close()

print data

获得这样的 HTML 标记并且它有效。

我想做的是,从内部获取值(value)<font class="big"></font>标签。例如。我需要这个例子中的数据值:

<font class="big">Data</font>

怎么做?

最佳答案

您可以使用 HTML 解析器模块,例如 BeautifulSoup :

from bs4 import BeautifulSoup as BS
url ="mydomain.com"
usock = urllib2.urlopen(url)
data = usock.read()
usock.close()
soup = BS(data)
print soup.find('font', {'class':'big'}).text

这会找到一个标签 <font>class="big" .然后打印其内容。

关于python - 在python中获取html标签值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18656958/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com