gpt4 book ai didi

python - 使用BeautifulSoup根据文本内容删除元素

转载 作者:太空宇宙 更新时间:2023-11-03 16:26:26 25 4
gpt4 key购买 nike

我想删除包含单词“Amend”的表行 (tr) 元素。我怎样才能改变下面的代码来实现这一点?

for e in soup.findAll("tr"):
e.extract()

*** 编辑:

我尝试了以下方法,但没有成功:

for e in soup.findAll('tr', text = re.compile('.*Amend.*')):
e.extract()

*** 编辑:

这是我正在处理的页面:

https://www.sec.gov/cgi-bin/browse-edgar?action=getcompany&CIK=AAON&type=10&dateb=&owner=exclude&count=40

最佳答案

如何找到所有具有Amend的节点,转到up the treetr 并删除:

for amend in soup.find_all(text=re.compile("Amend")):
tr = amend.find_parent("tr")
if tr: # safety feature
tr.extract()

或者,您也可以使用 searching function :

for tr in soup.find_all(lambda node: node and \
node.name == "tr" and \
node.find(text=re.compile("Amend"))):
tr.extract()

关于python - 使用BeautifulSoup根据文本内容删除元素,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37951431/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com