gpt4 book ai didi

Python BeautifulSoup 提取 PHP 链接

转载 作者:行者123 更新时间:2023-12-04 16:20:03 24 4
gpt4 key购买 nike

我在使用 BeautifulSoup 的 Python 中遇到了问题。我需要提取页面上以“.php”结尾的所有文件,但它们也必须是本地文件。它们不能来自其他网站。这是我到目前为止:

    from bs4 import BeautifulSoup
import mechanize
import sys

url = sys.argv[1]

br = mechanize.Browser()
code = br.open(url)
html = code.read()
soup = BeautifulSoup(html)

这就是我被困在做什么的地方。我想象使用soup.findall 来获取所有“a href”标签。

最佳答案

试试这样,

page=urllib2.urlopen(url)
soup=BeautifulSoup(page.read())

for a in soup.findAll('a'):
if a['href'].endswith('.php'):
print a['href']

关于Python BeautifulSoup 提取 PHP 链接,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21757520/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com