gpt4 book ai didi

python-3.x - 如何在Python中使用BeautifulSoup从标记中提取innerHTML

转载 作者:行者123 更新时间:2023-12-03 11:25:41 28 4
gpt4 key购买 nike

我正在尝试使用以下代码从标记中提取innerHTML:

theurl = "http://na.op.gg/summoner/userName=Darshan"
thepage = urlopen(theurl)
soup = BeautifulSoup(thepage,"html.parser")
rank = soup.findAll('span',{"class":"tierRank"})

但是,我得到 [< span class="tierRank" > Master < /span >]代替。
我要显示的只是值“Master”。

使用 soup.get_text而不是 soup.findall不起作用。

我尝试将 .text.string添加到最后一行的末尾,但这也不起作用。

最佳答案

soup.findAll('span',{"class":"tierRank"})返回与<span class="tierRank">匹配的元素列表。

  • 您需要该列表中的第一个元素。
  • 您需要该元素中的innerHtml,可以通过decode_contents()方法进行访问。

  • 全部一起:
    rank = soup.findAll('span',{"class":"tierRank"})[0].decode_contents()

    这会将“Master”存储在 rank中。

    关于python-3.x - 如何在Python中使用BeautifulSoup从标记中提取innerHTML,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49911406/

    28 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com