gpt4 book ai didi

Python 抓取(Beautiful Soup)从这个 HTML 中获取数据

转载 作者:可可西里 更新时间:2023-11-01 13:31:50 25 4
gpt4 key购买 nike

 <ul>
<li>
<div class="c_logo_box">
<a href="money-transfer-companies/ria-money-transfer/"><img src="http://www.compareremit.com/uploads/ria-logo11.png" style="height:57px;width:147px;" alt="RIA Money Transfer"></a>
<span class="rs"> <span class="txt13">&#8377;</span> 61.24</span>
</div>
</li>
...

我希望从 'alt = Ria Money Transfer' 中删除 name 并从 span 61.24 中删除 rate

到目前为止,我有这段 Python 代码:

#!/usr/bin/python

import requests
import re
from bs4 import BeautifulSoup

r = requests.get('http://www.compareremit.com')
data = r.text

soup = BeautifulSoup(data)
for rate in soup.find_all('li', re.compile('money')):
print rate.text

它什么也没给我。有人能告诉我我错过了什么吗?此外,我无法想象我支持在 for 循环搜索中查找哪个元素,您能否大致说明在这种情况下如何知道在 for 循环中指定什么作为条件?

最佳答案

您的代码在逻辑上不正确。您可以通过多种方式执行此操作,请尝试此代码

#!/usr/bin/python

import requests
import re
from bs4 import BeautifulSoup

r = requests.get('http://www.compareremit.com')
data = r.text

soup = BeautifulSoup(data)
for rate in soup.find_all('div',{"class":"c_logo_box"}):
print rate.a.img['alt']
print rate.span.text

关于Python 抓取(Beautiful Soup)从这个 HTML 中获取数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28075119/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com