python - 如何让 Beautiful Soup 从 href 和 class 获取链接？-6ren

python - 如何让 Beautiful Soup 从 href 和 class 获取链接？

转载作者：可可西里更新时间：2023-11-01 13:14:38

<分区>

我正在编写一个脚本来从一个网站下载多个 FLAC，我正在使用 Beautiful Soup 获取 flac 链接并使用 urlopen 下载链接

我要BS搜索以.flac结尾的链接(我不知道文件名，只知道扩展名EX:1个文件是XXX.flac，另一个是YYY.flac)

flac 文件的 HTML 在这里

<b><a class=location href="/soundtracks/index.php">Soundtracks</a><font class=location> &raquo </font><a href="/soundtracks/highquality/index.php">High Quality Game 
Soundtracks [FLAC]</a><font class=location> &raquo </font><a href="/soundtracks/highquality/Metal_Gear_20th_Anniversary/72">Metal Gear 20th Anniversary</a><font class=location> &raquo 01 Metal Gear 20 Years History -Past, Present, Future- Download</font></b><h1>Metal Gear 20th Anniversary Download Links:</h1><a style="font-size: 16px; font-weight:bold;" href="http://50.7.161.234/bks/94/245/Music/[029] MG 20th Anniversary [FLAC]/01 Metal Gear 20 Years History -Past, Present, Future-.flac">Metal Gear 20th Anniversary - 01 Metal Gear 20 Years History -Past, Present, Future-</a> <font face="Verdana" style="font-size: 16px;">Format: FLAC, Size: 76M</font><br> <font face="Verdana" style="font-size: 10px;"><b>Note: If the file starts playing in your browser window, try right-clicking and "Save Target As"</b></font><br>

我试图找到 id。 t = soup.find(id="flac") 但我没有得到任何相关结果。我对此一无所知，我不知道有什么办法可以解决它

我如何让 BS 搜索并找到文件链接，然后将该文件链接分配给变量？

import mechanize
import urllib, urllib2, re
from bs4 import BeautifulSoup
####MECHANIZE####
br = mechanize.Browser()
res = br.open("http://www.emuparadise.me/soundtracks/highquality/Metal_Gear_20th_Anniversary/72")
a = 2 #COUNTER FOR LOOP
br.follow_link(text_regex='Download', nr=a)
b = br.geturl() #GETS THE URL
print b


page = urllib2.urlopen(b).read()
soup = BeautifulSoup(page)
soup.prettify()
t = soup.find(id="")
print t

文章推荐： javascript - 使用 D3.js 只渲染 topojson map 的一部分

文章推荐： .net - WPF - 在 SYSTEM 帐户下执行进程时性能低下

文章推荐： php - 为 Laravel 路由添加 url 扩展

可可西里

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

python - 如何让 Beautiful Soup 从 href 和 class 获取链接？