gpt4 book ai didi

python - 带/不带类和字符串的 p 标签

转载 作者:太空宇宙 更新时间:2023-11-03 18:50:05 25 4
gpt4 key购买 nike

我是 python 新手,我正在尝试了解 BeautifulSoup。

我编写了这段代码,它可以工作,但不是我想要的方式:

for abc in soup.findAll(['p',{'a':re.compile('href="/download/*')}]):
value=abc.text
print value

页面有多个“ block ”,如下所示:

<div class="">
<div class="ABC">
<p>
<a href="/download/1234/abcde/fghij">String1</a>
</p>
<p class="data">
String2 <a href="/user/4649/abc">String3</a> String2
</p>
</div>
<img src="/img/abc.png" alt="String4" title="String5" />
</div>

我想读取所有这些“ block ”并转换为字典(?):[链接'/download/1234/abcde/fghij',名称'String1',用户'String3',alt'String4,标题'String5']

有了这个,我可以搜索名称并获取链接

最佳答案

尝试这样的事情:

for outer in soup.find_all("div", attrs={"class": ""}):
a = outer.find("a")
img = outer.find("img")
entry = { "Link": a.get("href")
, "Name": a.text
, "User": outer.find("p", "data").find("a").text
, "alt": img.get("alt")
, "title": img.get("title")
}
print entry

这会检索您想要的内容并将它们放入字典中。

关于python - 带/不带类和字符串的 p 标签,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18550060/

25 4 0