gpt4 book ai didi

beautifulsoup - 如何获取 bs4.element.Tag 最外层标签被移除的原始字符串?

转载 作者:行者123 更新时间:2023-12-05 07:41:32 25 4
gpt4 key购买 nike

我在 main.py 中有以下代码

#!/usr/bin/env python
# vim: set noexpandtab tabstop=2 shiftwidth=2 softtabstop=-1:

import sys
from bs4 import BeautifulSoup

soup = BeautifulSoup(sys.stdin.read(), 'html.parser')
print type(soup.find('a'))
print str(soup.find('a'))

结果如下。但我不想打印最外面的标签(即,在这种情况下)。有没有办法在没有最外层标签的情况下稳健地打印原始字符串?

$ ./main.py <<EOF
> <a>x<b>y</b></a>
> EOF
None
<class 'bs4.element.Tag'>
<a>x<b>y</b></a>

最佳答案

print soup.find('a').get_text()

tag_string = ''
for item in soup.find('a').contents:
tag_string += str(item)
print tag_string

关于beautifulsoup - 如何获取 bs4.element.Tag 最外层标签被移除的原始字符串?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45249657/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com