gpt4 book ai didi

python - 从谷歌驱动器 url 读取带有 Pandas 的 csv 时出错

转载 作者:行者123 更新时间:2023-12-04 15:07:14 32 4
gpt4 key购买 nike

我正在尝试从谷歌驱动器读取带有 Pandas 的 cvs 文件。
Pandas 从我的电脑读取它时它是正确的,但是当我尝试从我从 google drive 获得的 url 读取它以共享文件时,它似乎正在读取其他东西,或者 google drive 正在对文件做一些奇怪的事情。 ..继承人我所做的:

alread_url = 'https://drive.google.com/file/d/1am7jNHA6Lewzws_K'
pd.read_csv(alread_url, squeeze=True, error_bad_lines=False)

b'Skipping line 6: expected 1 fields, saw 2\nSkipping line 7: expected 1 fields
\nSkipping line 25: expected 1 fields, saw 2\nSkipping line 42: expected 1 fields, saw
2\nSkipping line 43: expected 1 fields, saw 2... some more similar errors
我把它作为数据帧
<!DOCTYPE html>
0 <html lang="en">
1 <head>
2 <meta charset="utf-8">
3 <meta name="google-site-verification" conten...
4 <title>Meet Google Drive – One place for all...
... ...
1647 <script type="text/javascript" nonce="3QmHtC...
1648 'https:\x2F\x2Faccounts.google.com\x2FPassiv...
1649 </script>
1650 </body>

1651 </html>
1652 rows × 1 columns
另一件事要说的是,我在 google colab notebook 中运行了这个......
主要目标是从谷歌驱动器读取 csv 和 xlsx 文件,而无需在任何地方下载文件,因此,如果您知道该怎么做,我真的不在乎我是否无法解决这个问题。
编辑:这是 Pandas 试图读取为 csv 的原始文本: \n<!DOCTYPE html>\n<html lang="en">\n <head>\n <meta charset="utf-8">\n <meta content="width=300, initial-scale=1" name="viewport">\n <meta name="description" content="Google Drive is a free way to keep your files backed up and easy to reach from any phone, tablet, or computer. Start with 15GB of Google storage – free.">\n <meta name="google-site-verification" content="LrdTUW9psUAMbh4Ia074-BPEVmcpBxF6Gwf0MSgQXZs">\n <title>Meet Google Drive – One place for all your files</title>\n <style>\n @font-face {\n font-family: \'Open Sans\';\n font-style: normal;\n font-weight: 300;\n src: url(//fonts.gstatic.com/s/opensans/v15/mem5YaGs126MiZpBA-UN_r8OUuhs.ttf) format(\'truetype\');\n}\n@font-face {\n font-family: \'Open Sans\';\n font-style: normal;\n font-weight: 400;\n src: url(//fonts.gstatic.com/s/opensans/v15/mem8YaGs126MiZpBA-UFVZ0e.ttf) format(\'truetype\');\n}\n </style>\n <style>\n h1, h2 {\n -webkit-animation-duration: 0.1s;\n -webkit-animation-name: fontfix;\n

最佳答案

简短回答 - 您不能将 Google Drive URL 输入 pd.read_csv() .您必须下载 CSV 文件并使用它的实际路径。
基本上,Google Drive URL 会显示有一些 CSV 文件。实际上,它只是一个网站(包含 HTML 内容),向您显示有关他们托管的 CSV 文件的一些信息。这就是你看到的:<!DOCTYPE html>... .
在本地,这是有效的,因为您使用了 Pandas 可以读取的实际文件系统路径。如果要对远程文件执行此操作,则必须获取该文件,以便它在本地文件系统中可用。一般来说,您可以使用 wgetcurl命令,但这对于 Google Drive 来说并不简单,因为您需要使用 Google 帐户进行身份验证才能访问该文件。关于如何做到这一点有一些想法herehere .
在 Python/Jupyter notebook 中下载文件的最佳方法是使用 gdown .您可以通过 pip 安装它并提供您的 URL,它会为您下载。

# install gdown in terminal
pip install gdown

# download your file
gdown 'https://drive.google.com/uc?id=1iE1nHPJvglklttBEqX92_Mfg6421CtMq'
请注意我们提供给 gdown 的 URL .
import pandas as pd
pd.read_csv('/path/to/file.csv')
我创建了 an example notebook在 Deepnote 中,你可以在本地 Python repl、VSCode、Jupyter notebook 或 Google Colab 中执行相同的操作。
有一种特殊的方式可以让您通过安装 Drive 从 Colab 连接到 Drive。更多相关信息 here .

关于python - 从谷歌驱动器 url 读取带有 Pandas 的 csv 时出错,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/65888541/

32 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com