gpt4 book ai didi

python - 用 Beautiful Soup 解析 HTML。从特定标签返回文本

转载 作者:太空狗 更新时间:2023-10-30 02:20:07 24 4
gpt4 key购买 nike

我可以像这样通过 unix shell 脚本解析 html 标签的完整参数:

# !/usr/bin/python3

# import the module
from bs4 import BeautifulSoup

# define your object
soup = BeautifulSoup(open("test.html"))

# get the tag
print(soup(itemprop="name"))

其中 itemprop="name" 唯一标识所需的标签。

输出类似于

[<span itemprop="name">
Blabla &amp; Bloblo</span>]

现在我只想返回 Bla Bla Blo Blo 部分。

我的尝试是:

print(soup(itemprop="name").getText())

但我收到一条错误消息,如 AttributeError: 'ResultSet' object has no attribute 'getText'

它在其他情况下实验性地工作,例如

print(soup.find('span').getText())

那我哪里错了?

最佳答案

soup 对象用作可调用对象会返回一个列表 结果,就像您使用 soup.find_all() 一样。查看documentation :

Because find_all() is the most popular method in the Beautiful Soup search API, you can use a shortcut for it. If you treat the BeautifulSoup object or a Tag object as though it were a function, then it’s the same as calling find_all() on that object.

使用soup.find()只找到第一个匹配项:

soup.find(itemprop="name").get_text()

或索引到结果集中:

soup(itemprop="name")[0].get_text()

关于python - 用 Beautiful Soup 解析 HTML。从特定标签返回文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25267923/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com