gpt4 book ai didi

python - 从标签中获取数据(BeautifulSoup)

转载 作者:太空宇宙 更新时间:2023-11-03 18:37:38 24 4
gpt4 key购买 nike

简要说明:我有一个脚本,它循环访问页面的元素,然后返回数据。但我希望它返回的数据不在元素中,而是按顺序返回。

import argparse, os, socket, urllib2, re
from bs4 import BeautifulSoup
pge = urllib2.urlopen("").read()
src = BeautifulSoup(pge)
body = src.findAll('body')
el = body[0].findChildren()
for s in el:
cname = s.get('class')
if cname[0] == "work":
print s.text

HTML:

<body>
<div class="work">1</div>
<span class="nope">tosee</span>
<span class="work">2</span>
<span class="work">3</span>
4
<span class="work">5</span>
<span class="no">nothing</span>
</body>

它打印 1235 并错过了 4,但我希望它打印 12345

最佳答案

简单地说:

print soup.find('body').text

关于python - 从标签中获取数据(BeautifulSoup),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21248554/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com