gpt4 book ai didi

python - 当某些字符串与 BeautifulSoup 相邻时如何提取它们

转载 作者:行者123 更新时间:2023-11-28 01:06:00 26 4
gpt4 key购买 nike

我正在解析 BeautifulSoup 的 HTML 页面结果,我感兴趣的部分如下所示:

<i class="fa fa-circle align-middle font-80" style="color: #45C414; margin-right: 15px"></i>Departure for <a href="/en/ais/details/ports/17787/port_name:TEKIRDAG/_:3525d580eade08cfdb72083b248185a9" title="View details for: TEKIRDAG">TEKIRDAG</a> </td>

我对提取 port_name 很感兴趣,TEKIRDAG,但是有许多端口名称的标签相同。我的问题是,如果 port_name 出现在字符串 'Departure for' 之后,是否有一种方法可以只提取它?

最佳答案

您可以找到文本节点并获得 next sibling :

In [1]: from bs4 import BeautifulSoup

In [2]: data = """<i class="fa fa-circle align-middle font-80" style="color: #45C414; margin-right: 15px"></i>Departu
...: re for <a href="/en/ais/details/ports/17787/port_name:TEKIRDAG/_:3525d580eade08cfdb72083b248185a9" title="Vie
...: w details for: TEKIRDAG">TEKIRDAG</a> </td>"""
...:

In [3]: soup = BeautifulSoup(data, "html.parser")

In [4]: soup.find(text="Departure for ").next_sibling.get_text()
Out[4]: u'TEKIRDAG'

关于python - 当某些字符串与 BeautifulSoup 相邻时如何提取它们,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39748092/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com