python - 如何使用 Python Mechanize 从基于 Web 的文件服务器下载文件-6ren

python - 如何使用 Python Mechanize 从基于 Web 的文件服务器下载文件

转载作者：太空狗更新时间：2023-10-30 02:49:46

26

4

我在私有(private) ftp 文件服务器上有一系列文件，我正尝试使用 mechanize 下载这些文件。

Mechanize 链接对象具有结构

Link(base_url='http://myfileserver.com/cgi-bin/index.cgi', url='index.cgi?page=download&file=%2Fhome%2Fjmyfileserver%2Fpublic_html%2Fuser_data%2Fmycompany%2F.ftpquota', text='Download [IMG]', tag='a', attrs=[('href', 'index.cgi?page=download&file=%2Fhome%2Fjmyfileserver%2Fpublic_html%2Fuser_data%2Fmycompany%2F.ftpquota'), ('class', 'ar')])

这基本上对应于文件图标链接到文件的链接

我是 Mechanize 的新手。
但是我如何下载链接文件可以从

urlparse.urljoin(base_url , url)

将两者结合起来得到:

http://myfileserver.com/cgi-bin/index.cgi?page=download&file=%2Fhome%2Fjmyfileserver%2Fpublic_html%2Fuser_data%2Fmycompany%2F.ftpquota

我不知道如何进行。

我的原始代码

import mechanize
import subprocess
import urlparse
br = mechanize.Browser()
br.open("http://myfileserver.com/cgi-bin/index.cgi")
br.select_form(nr=0)
br['login'] = "mylogin"
br['password'] = "mypassword"
br.submit()
#print dir(br)
myfiles = []
for alink in br.links():
    print alink
    myfiles.append(alink)

def downloadlink(l):
    print " Trying to download", l.url.split("%2F")[-1]
    f=open(l.url.split("%2F")[-1],"w") 
    myurl = urlparse.urljoin(l.base_url,l.url)
    print myurl
    # Dont know how to proceed



for linkobj in myfiles:

    if "sca" in linkobj.url:
        #br.follow_link(text='[IMG]', nr=0)
        downloadlink(linkobj)

最佳答案

你可以试试:

for index, linkobj in enumerate(myfiles):
    if "sca" in linkobj.url:
        resp = br.follow_link(text='Download [IMG]',nr=0)
        content = resp.read()
        with open('output%s.txt' % index, 'w') as fo:
           fo.write(content)

关于python - 如何使用 Python Mechanize 从基于 Web 的文件服务器下载文件，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/6662774/

26

4

0

文章推荐： python - 我是否误解了如何使用 Python 设置 Selenium RC？

文章推荐： python - Django 评论

asp.net - 服务器.MapPath (".")，服务器.MapPath ("~")，服务器.MapPath(@"\")，服务器.MapPath ("/")。有什么不同？
谁能解释一下 Server.MapPath(".")、Server.MapPath("~")、Server.MapPath(@"之间的区别\") 和 Server.MapPath("/")？最佳答案
c# - 服务器.UrlEncode & 服务器.UrlDecode
我不知道，为什么我们要使用 Server.UrlEncode() & Server.UrlDecode()？!在 QueryString 中我们看到 URL 中的任何内容，那么为什么我们要对它们进行编
ssl - 服务器 SSL 不完整链(Inmotion 服务器)
我已经通过 WHM 在我的一个域上安装了 ssl 证书。网站正在使用 https://xyz.com . 但是它不适用于 https://www.xyz.com .我已经检查了证书，它也适用于 www
c++ - 如何在 C++ 中使用 WMI 或其他 WMI 检测安装在 Windows 2003 服务器和 2008 服务器 2003 服务器 R2 和 2008 服务器 R2 上的防病毒软件
我已经使用 WMI 检测操作系统上是否存在防病毒软件，itz 正常工作并通过使用命名空间向我显示防病毒信息，例如 win xp 和 window7 上的名称和实例 ID:\root\SecurityC
Hive 服务器 1 与 Hive 服务器 2
我们有 hive 0.10 版本，我们想知道是否应该使用 Hive Server 1 或 Hive Server2。另一个问题是连接到在端口 10000 上运行的 Hive 服务器，使用 3rd 方工
c++ - Windows Http 服务器 API HTTPS 服务器
我想在 C++ 中使用 Windows Server API 设置一个 HTTPS 服务器，我使用了示例代码，它在 HTTP 上工作正常，但我就是不能让它在 HTTPS 上工作。 (我不想要客户端 S
c# - smtpclient 不适用于 Exchange 服务器，但适用于 smtp 服务器
我写了一个非常基本的类来发送电子邮件。我用 smtp 服务器对其进行了测试，它工作正常，但是当我尝试使用我公司的交换服务器时，它给出了这个异常: SMTP 服务器需要安全连接或客户端未通过身份验证。服
delphi - DataSnap 服务器 - 将 HTTP 请求重定向到另一个 DataSnap 服务器
我的应用程序包含一个“网关”DataSnap REST 服务器，它是所有客户端的第一个访问点。根据客户端在请求中传递的用户名(基本身份验证)，请求需要重定向到另一个 DataSnap 服务器。我的问题
java - Servlet 适用于我的 Tomcat 服务器，但不适用于我的 Glassfish4 服务器
我有一个 Tomcat 服务器和一个 Glassfish4 服务器。我的 Servlet 在 Tomcat 服务器上启动得很好，但在 Glassfish4 服务器上给我一个“HTTP Status 4
linux - 无法从托管虚拟机(即我的 ubuntu 服务器)的计算机以外的其他计算机访问 ubuntu 服务器
我在 vmware 上创建了一个 ubuntu 服务器。我用它作为文件服务器。如果我通过托管虚拟机的计算机进行连接，则可以访问它。我无法从同一网络上的其他计算机执行此操作。提前致谢! 最佳答案首先确
ruby-on-rails - 重新启动 rails 服务器，分离 rails 服务器
如何重启 Rails 服务器？我从开始 rails server -d 所以服务器是分离的我知道的唯一方法就是去做ps 辅助 | grep rails 并 kill -9关于过程#但是像这样杀死进
XMPP 服务器 Vysper 与 OpenFire/Tigase(如何创建简单的 XMPP 服务器)
我实际上正在尝试找到编写一个简单的 XMPP 服务器的最佳方法，或者找到一个占用空间非常小的服务器。我只关心XMPP的核心功能(状态、消息传递、群组消息传递)。目前还在学习 XMPP 协议(proto
XMPP 服务器 Vysper 与 OpenFire/Tigase(如何创建简单的 XMPP 服务器)
我实际上正在尝试找到编写简单 XMPP 服务器的最佳方法，或者找到一个占用空间非常小的方法。我只关心 XMPP 的核心功能(统计、消息、组消息)。目前也在学习 XMPP 协议(protocol)，所以
java - 在 MobileFirst 服务器(Liberty 服务器)中使用 jax-ws
我们正在尝试从 Java JAX-RS 适配器访问 SOAP 1.1 Web 服务。我们正在使用从 WSDL 生成的 SOAP 客户端。但是当解码 SOAP 故障时，我们得到以下异常: ... C
Python 在代码中启动 HTTP 服务器(创建 .py 以启动 HTTP 服务器)
目前，我和许多其他人正在多个平台(Windows、OS X 和可能的 Linux)上使用 Python HTTP 服务器。我们正在使用 Python HTTP 服务器来测试 JavaScript 游戏
c# - C# 服务器(不是 Web 服务器)和 PHP 之间的数据交换
我有一个连续运行的服务器程序(C#/.NET 2.0 on Linux with mono)，我想从 PHP 脚本连接到它以在网站上显示状态信息。目的是创建一个(某种)实时浏览器游戏(无 Flash
facebook-graph-api - 应用 > OAuth2 服务器 > Facebook > OAuth2 服务器 > 应用
所以我有一个单页客户端应用程序。正常流程: 应用程序 -> OAuth2 服务器 -> 应用程序我们有自己的 OAuth2 服务器，因此人们可以登录应用程序并获取与用户实体关联的 access_t
msbuild - 升级 Web 服务器(服务器 2012 R2)后，Web 部署现在失败
我们刚刚将测试 Web 服务器从 Server 2008 升级到 Server 2012 R2。我们有一个部署我们网站的批处理脚本。当它将站点推送到服务器时，它现在失败了。奇怪的是，我可以使用相同的发
apache - 无法启动 SpagoBI 服务器(多合一 spagobi 服务器)版本 5.2
建议一些加载SpagoBI服务器的方法，我尝试了所有方法来解析spagobi服务器。在 Catalina 中，错误是 - * SEVERE: Unable to process Jar entry [
node.js - nodejs 服务器与 apache tomcat 服务器(App 服务器)有何不同？
当我们点击应用程序服务器(apache tomcat)时，它会创建一个线程来处理我们的请求并与 tomcat 连接，建立连接，tomcat 创建另一个线程来处理请求并将其传递给连接，连接线程将其传递给

首页

博学

6Ren·AI

商城

python - 如何使用 Python Mechanize 从基于 Web 的文件服务器下载文件