gpt4 book ai didi

python 从 web URL 读取文件

转载 作者:行者123 更新时间:2023-11-28 21:13:20 27 4
gpt4 key购买 nike

我目前正在尝试从网站读取一个 txt 文件。

到目前为止我的脚本是:

webFile = urllib.urlopen(currURL)

这样,我就可以处理文件了。但是,当我尝试存储文件时(在 webFile 中),我只得到一个到套接字的链接。我尝试的另一种解决方案是使用 read()

webFile = urllib.urlopen(currURL).read()

然而,这似乎删除了格式(\n\t 等)。

如果我这样打开文件:

 webFile = urllib.urlopen(currURL)

我可以逐行阅读:

for line in webFile:
print line

这将导致:

"this" 
"is"
"a"
"textfile"

但是我得到:

't'
'h'
'i'
...

我希望在我的电脑上获取文件,但同时保持格式。

最佳答案

你应该使用 readlines() 来读取整行:

response = urllib.urlopen(currURL)
lines = response.readlines()
for line in lines:
.
.

但是,我强烈建议您使用requests 库。链接在这里http://docs.python-requests.org/en/latest/

关于python 从 web URL 读取文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32971752/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com