gpt4 book ai didi

python - 从给定 URL 下载文件并使用 Google Colab 保存文件时出现问题

转载 作者:行者123 更新时间:2023-12-02 16:09:40 28 4
gpt4 key购买 nike

我在 GitHub 中有一些 java 文件的 URL。我想将 URL 传递给方法,下载文件并使用不同的唯一名称保存它。

这是我写的代码,它有代码片段下面提到的问题。

!pip install wget

import wget
from datetime import datetime


def download_file(url):

# Creating file name
now_time =datetime.now()
millisec = now_time.timestamp() * 10000
millisec = str(millisec).split('.')[0]
partial_name = url.split('/')[-1].split('.')[0]
file_name = partial_name + millisec + '.java'

# Download the file and save in colab location
wget.download(url, file_name)

return file_name

我传递给此方法的示例 URL 是“https://github.com/e32wong/CloCom/blob/master/CloneDigger.java”

问题是,下载的 java 文件的内容显示为充满标签的 HTML 内容。但是,GitHub 上的原始文件是一个简单的 java 文件。

我想按原样保存文件。请解决此问题。

最佳答案

问题出在 URL 上。您必须传递文件的原始 URL。

Page URL:'https://github.com/e32wong/CloCom/blob/master/CloneDigger.java'

Raw URL: 'https://raw.githubusercontent.com/e32wong/CloCom/master/CloneDigger.java'

您可以通过替换它轻松修改 url。试试这个。

def download_file(url):

# Creating file name
now_time =datetime.now()
millisec = now_time.timestamp() * 10000
millisec = str(millisec).split('.')[0]
partial_name = url.split('/')[-1].split('.')[0]
file_name = partial_name + millisec + '.java'

#Edit url as the raw file url of github
url = url.replace('github.com', 'raw.githubusercontent.com', 1)
url = url.replace('/blob/', '/',1)

# Download the file and save in colab location

wget.download(url, file_name)

return file_name

关于python - 从给定 URL 下载文件并使用 Google Colab 保存文件时出现问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/68354212/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com