python-3.x - 使用 BeautifulSoup 和 ftlib 访问 ftp 网站时出错-6ren

python-3.x - 使用 BeautifulSoup 和 ftlib 访问 ftp 网站时出错

转载作者：行者123 更新时间：2023-12-04 01:53:40

24

4

我正在尝试访问网页以下载如下数据:

from bs4 import BeautifulSoup
import urllib.request
from lxml import html

download_url = "ftp://nomads.ncdc.noaa.gov/NARR_monthly/"

s = requests.session()                                                         


page = BeautifulSoup(s.get(download_url).text, "lxml")

但这会返回:

Traceback (most recent call last):

  File "<ipython-input-271-59c5b15a7e34>", line 1, in <module>
    r = requests.get(download_url)

  File "/anaconda3/lib/python3.6/site-packages/requests/api.py", line 72, in get
    return request('get', url, params=params, **kwargs)

  File "/anaconda3/lib/python3.6/site-packages/requests/api.py", line 58, in request
    return session.request(method=method, url=url, **kwargs)

  File "/anaconda3/lib/python3.6/site-packages/requests/sessions.py", line 508, in request
    resp = self.send(prep, **send_kwargs)

  File "/anaconda3/lib/python3.6/site-packages/requests/sessions.py", line 612, in send
    adapter = self.get_adapter(url=request.url)

  File "/anaconda3/lib/python3.6/site-packages/requests/sessions.py", line 703, in get_adapter
    raise InvalidSchema("No connection adapters were found for '%s'" % url)

InvalidSchema: No connection adapters were found for 'ftp://nomads.ncdc.noaa.gov/NARR_monthly/'

即使该网站正在运行。

通常，如果它有效，我会像这样循环遍历每个链接:

for a in page.find_all('a', href=True):
    file = a['href']
    print (file)

我也试过这个:

import ftplib

ftp = ftplib.FTP(download_url)

但这会返回:

  File "<ipython-input-284-60bd19e600fe>", line 1, in <module>
    ftp = ftplib.FTP(download_url)

  File "/anaconda3/lib/python3.6/ftplib.py", line 117, in __init__
    self.connect(host)

  File "/anaconda3/lib/python3.6/ftplib.py", line 152, in connect
    source_address=self.source_address)

  File "/anaconda3/lib/python3.6/socket.py", line 704, in create_connection
    for res in getaddrinfo(host, port, 0, SOCK_STREAM):

  File "/anaconda3/lib/python3.6/socket.py", line 745, in getaddrinfo
    for res in _socket.getaddrinfo(host, port, family, type, proto, flags):

gaierror: [Errno 8] nodename nor servname provided, or not known

最佳答案

不幸的是 requests不支持 FTP 链接，但你可以使用内置的 urllib模块。

import urllib.request

download_url = "ftp://nomads.ncdc.noaa.gov/NARR_monthly/"
with urllib.request.urlopen(download_url) as r:
    data = r.read()

print(data)

响应不是 html，因此您无法使用 BeautifulSoup 解析它，但您可以使用正则表达式或字符串操作。

links = [
    download_url + line.split()[-1] 
    for line in data.decode().splitlines()
]
for link in links:
    print(link)

您也可以使用 ftplib如果您愿意，但您只能使用主机名。然后你可以 cd 到 'NARR_monthly' 并获取数据。

from ftplib import FTP

with FTP('nomads.ncdc.noaa.gov') as ftp:
    ftp.login() 
    ftp.cwd('NARR_monthly')
    data = ftp.nlst()

path = "ftp://nomads.ncdc.noaa.gov/NARR_monthly/"
links = [path + i for i in data]

有时主机会因为客户端太多而拒绝连接，因此您可能需要使用 try-except block 。

关于python-3.x - 使用 BeautifulSoup 和 ftlib 访问 ftp 网站时出错，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/51826961/

24

4

0

文章推荐： tableau-api - 画面提取与现场直播

文章推荐： r - ggplot 点中的轻微点描边

文章推荐： css - 如何创建不同颜色的左上角和右下角边框？

文章推荐： angular - 在 Angular 6 中写入文件

ftp - 为什么我们需要在 ftp 服务器和 ftp 客户端之间建立两个连接
根据 FTP 协议(protocol)(rfc 959)，当 ftp 客户端连接到 ftp 服务器时，应该在 ftp 客户端和 ftp 服务器之间建立控制连接。而当ftp客户端发送{LIST, R
ftp - 是否可以使用 FTP 命令重命名 FTP 文件夹？
是否可以使用 FTP 命令重命名 FTP 服务器上的文件夹？我知道有一个用于文件重命名的 Rename 命令，但是我可以将它用于文件夹名称吗？最佳答案 AFAIK，相同的命令( RNFR/RNTO
ftp - 使用 inets FTP 服务器恢复 FTP 下载
我有一个 ftp://host/path URL，我想下载文件并在 Erlang 中连接丢失时继续下载。使用 ftp 开始下载非常简单模块，但如何恢复它？最佳答案是的..就像 Peer 提到的.
ftp - ftp 回复如何工作
我一直在阅读 FTP 规范并使用 Wireshark 来捕获我的 FTP 客户端发送/接收的数据包，并有一些关于它们的问题。首先是来自我的 FTP 服务器的“连接问候语”(如 FTP RFC 所称)
ftp - 为什么 CF FTP 传输速度比标准 FTP 慢数倍？
我有一个 ColdFusion 应用程序，用于在开发和生产服务器之间传输文件。实际发送文件的代码如下: ftp = new Ftp(); ftp.setUsername(username); ftp.
ftp - 如何使用 ftp (/usr/bin/ftp) 匿名登录？
我正在尝试连接到允许匿名访问的 FTP 服务器，但我不知道如何指定执行此操作所需的适当用户名/密码。我尝试过使用匿名/匿名作为用户/通行证，但没有成功，以及空字符串和两者的各种组合等。这一定是我所
ftp - Solaris 10 上 ftp rstatus 的等效 ftp 命令？
ftp rstatus $remotefile 在Solaris 上出现“？无效命令”错误。我发现，与 HP-UX 不同，Solaris 10 上没有像 rstatus 这样的 ftp 命令。基本上在
java - 使用 spring 集成 ftp 支持将文件从 ftp 服务器传输到另一个 ftp 服务器
我是 Spring 的新手，我目前正在研究 spring 与 ftp 支持的集成。我从本地目录传输到服务器 (filZilla)。我从服务器下载了文件，没问题。但我想知道如何将文件从 FTP 服
ftp - 如何在 PHP 中通过 TLS 使用隐式 FTP 建立 FTP 连接
我想通过加密连接 FTP，需要使用 PHP 代码通过 TLS 隐式 FTP。我已经尝试使用普通 FTP 进行加密，它可以工作，但加密需要通过 TLS 的隐式 FTP 不起作用。最佳答案尝试使用下
ftp - LuaSocket FTP 总是超时
我已经成功使用 LuaSocket 的 TCP 工具，但我在使用它的 FTP 模块时遇到了问题。尝试检索(小)文件时，我总是超时。我可以在被动模式下使用 Firefox 或 ftp 下载文件(在 Ub
ftp - 我们可以使用 FTP 详细信息登录腻子吗
我尝试使用 putty 使用 FTP 详细信息主机名、用户名和密码登录到服务器。但是当我输入密码时它显示拒绝访问。对于我的另一个网站，我输入了我的主机名并单击在腻子中打开，它显示“网络错误:连接超时
ftp - 什么会超越 FTP，为什么我们还不使用它？
只是我，还是 FTP 看起来有点过时？它看起来很慢而且效率低下，而且它已经有 30 多年的历史了，并不是所有的旧东西都是坏的 :) 有哪些协议(protocol)可能成为 FTP 的继任者？我用过一
ftp - 如何在批处理脚本中捕获 ftp 错误代码？
我有一个有点相关但不同的问题 here . 我有一个批处理脚本( *.bat 文件)，例如: @ftp -i -s:"%~f0"&GOTO:EOF open ftp.myhost.com myuser
ftp - 如何通过 FTP 发送我最近的数据集？
我正在使用 IBM Mainframe TSO 从数据集中查看文件。最近有人告诉我每天开始将最新一代的数据集通过 FTP 传输到我桌面上的文件夹中。问题是我的 FTP 脚本只允许我用我输入的确切名称
ftp - 使用远程 FTP 原子包和私钥发出与服务器的连接
我正在尝试使用 atom 包“Remote-FTP”和私钥连接到我的服务器。我在我的服务器上设置了 SSH key ，并且可以使用腻子成功连接。私钥保存在我的项目文件夹中，我有一个现有的 .ftp
ftp - 使用 ftp 重命名多个文件
我的 ftp 文件夹中有一组文件。我只能访问 ftp 模式。我想将那些扩展名为 .txt 的文件重命名为 .done 例如: 1.txt, 2.txt, 3.txt 到 1.done, 2.done,
ftp - 有没有办法列出 ftp 中本地目录的内容？
lcd 更改本地目录。 ls 列出远程目录上的文件。我想要的是lls，列出本地目录上的文件。这可能吗？我知道我总是可以打开另一个终端来执行此操作，但我很懒! 最佳答案是的: !dir ! 告诉
ftp - 哪个文件访问最好 : Webdav or FTP?
关闭。这个问题是opinion-based 。目前不接受答案。想要改进这个问题吗？更新问题，以便 editing this post 可以用事实和引文来回答它。 . 已关闭 9 年前。社区去年审查
ftp - Telnet 和被动 FTP
我的 FTP 测试服务器有问题。我已经安装并配置了 FileZilla 服务器，它正在监听端口 21 上的控制连接，然后它可以在 50100 和 51100 之间的端口上提供被动模式数据连接。我正在
ftp - Filezilla FTP 服务器无法检索目录列表
我正在运行 Filezilla Server 0.9.45 beta 来远程管理我的服务器。设置完成后，我测试使用 IP 127.0.0.1 连接到它，并且工作成功。但是，为了远程连接到服务器，我将端

首页

博学

6Ren·AI

商城

python-3.x - 使用 BeautifulSoup 和 ftlib 访问 ftp 网站时出错