python - 在 Pandas 中加载通用的 Google 电子表格-6ren

python - 在 Pandas 中加载通用的 Google 电子表格

转载作者：太空狗更新时间：2023-10-29 22:26:18

28

4

当我尝试在 pandas 中加载 Google 电子表格时

from StringIO import StringIO  
import requests
r = requests.get('https://docs.google.com/spreadsheet/ccc?key=<some_long_code>&output=csv')
data = r.content
df = pd.read_csv(StringIO(data), index_col=0)

我得到以下信息:

CParserError: Error tokenizing data. C error: Expected 1316 fields in line 73, saw 1386

为什么？我认为可以用数据识别电子表格行和列集，并将电子表格行和列分别用作数据框索引和列(NaN 表示任何空值)。为什么会失败？

最佳答案

我的这个问题说明了如何 Getting Google Spreadsheet CSV into A Pandas Dataframe

正如其中一位评论员指出的那样，您没有要求提供 CSV 格式的数据，您在网址末尾有“编辑”请求您可以使用此代码并查看它在电子表格上的工作情况(顺便说一下，它需要公开..)也可以做私有(private)工作表，但这是另一个话题。

from StringIO import StringIO  # got moved around in python3 if you're using that.

import requests
r = requests.get('https://docs.google.com/spreadsheet/ccc?key=0Ak1ecr7i0wotdGJmTURJRnZLYlV3M2daNTRubTdwTXc&output=csv')
data = r.content

In [10]: df = pd.read_csv(StringIO(data), index_col=0,parse_dates=['Quradate'])

In [11]: df.head()
Out[11]: 
          City                                            region     Res_Comm  \
0       Dothan  South_Central-Montgomery-Auburn-Wiregrass-Dothan  Residential   
10       Foley                              South_Mobile-Baldwin  Residential   
12  Birmingham      North_Central-Birmingham-Tuscaloosa-Anniston   Commercial   
38       Brent      North_Central-Birmingham-Tuscaloosa-Anniston  Residential   
44      Athens                 North_Huntsville-Decatur-Florence  Residential   

          mkt_type            Quradate  National_exp  Alabama_exp  Sales_exp  \
0            Rural 2010-01-15 00:00:00             2            2          3   
10  Suburban_Urban 2010-01-15 00:00:00             4            4          4   
12  Suburban_Urban 2010-01-15 00:00:00             2            2          3   
38           Rural 2010-01-15 00:00:00             3            3          3   
44  Suburban_Urban 2010-01-15 00:00:00             4            5          4

用于获取 csv 输出的新 Google 电子表格 url 格式是

https://docs.google.com/spreadsheets/d/177_dFZ0i-duGxLiyg6tnwNDKruAYE-_Dd8vAQziipJQ/export?format=csv&id

好吧，他们再次稍微更改了 url 格式，现在您需要:

https://docs.google.com/spreadsheets/d/177_dFZ0i-duGxLiyg6tnwNDKruAYE-_Dd8vAQziipJQ/export?format=csv&gid=0 #for the 1st sheet

我还发现我需要执行以下操作来处理 Python 3 对上述内容的轻微修改:

from io import StringIO

获取文件:

guid=0 #for the 1st sheet
act = requests.get('https://docs.google.com/spreadsheets/d/177_dFZ0i-duGxLiyg6tnwNDKruAYE-_Dd8vAQziipJQ/export?format=csv&gid=%s' % guid)
dataact = act.content.decode('utf-8') #To convert to string for Stringio
actdf = pd.read_csv(StringIO(dataact),index_col=0,parse_dates=[0], thousands=',').sort()

actdf 现在是一个带有标题(列名)的完整 pandas 数据框

关于python - 在 Pandas 中加载通用的 Google 电子表格，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/24063629/

28

4

0

文章推荐： python - 使用 selenium webdriver 作为基类 python

文章推荐： c# - 查找字典的不同值

文章推荐： c# - GridView RowUpdating 没有获取新数据

文章推荐： c# - 格式化日期字符串缩写月份

java - 使用 google 电子表格 api 下载 google 电子表格
我这里有一个工作示例。 https://developers.google.com/google-apps/spreadsheets/我需要从用户的谷歌文档下载一些文件。 import com.goo
电子表格 |索引匹配 |
我需要您在以下方面的帮助: 假设我们有 3 个不同的组:(A、B、C) 我们在每个组中有几个值范围: (Eg. A has 0 - 100, 101 - 200 while B has 0 - 200
python +电子表格
谁能告诉我有什么方法可以从 python 连接到电子表格吗？我想从表单中存储一些数据并将其提交到谷歌电子表格。请帮助解决这个问题。我必须遵循哪些步骤？提前致谢... 最佳答案连接到 Google
电子表格 |使用日期的嵌套 IF 语句
我正在尝试计算 2019 年给定时间范围内的月数。我的数据如下所示: 我将开始日期和结束日期列的格式更改为“日期”。 “以月为单位的持续时间”和输出列具有数字格式。我接近它如下: 如果开始日期(年
grails 设计类和外部数据(电子表格)
在设计上有一点问题，希望我能在这里寻求建议。接受 grails 可能是完全错误的工具，但这就是生活。所以一直在努力开发一个网络应用程序，该应用程序基本上只是从谷歌电子表格中呈现大量信息并发回一些更新
python 网格控件/电子表格
我正在设计一个胖客户端(即非浏览器)Python 应用程序，它将与托管数据库进行通信。该应用程序的屏幕之一需要有一个网格/电子表格区域，允许显示多行数据、过滤、排序和更新多行信息。有人推荐一个具有此功
mysql - Django 电子表格
我在 Django 中有一个表单，可以将用户添加到 mySQL 数据库。然而，用户将不得不添加大量用户，并且一些信息将被复制和粘贴。所以我在想是否有一种方法可以有一个类似表单的电子表格，其中列标题是将
excel - 锁定 Excel 电子表格
我在 Outlook VBA 中编写了一个程序，它根据 Excel 电子表格的内容创建一些电子邮件。一切正常，但是当程序终止时，我继续运行“EXCEL.EXE”进程，该进程会锁定电子表格，因此其他人无
timezone - Google 电子表格 - 如何使用函数确定时区
如何使用公式来确定当前时区？我使用的公式给出了意想不到的结果。我的电子表格设置(文件 > 电子表格设置...): 时区: (GMT+01:00) 阿姆斯特丹我使用的公式: =TEXT(NOW()
excel - Google 电子表格 - 以持续时间格式转换总小时数
如何转换持续时间的小时数？示例:在单元格 A1 中，我有 176 . 我希望单元格 A2 有 176:00:00 我想在 176 小时(持续时间)内转换数字 176。那可能吗？因为如果我在单元格中键
excel - 条件格式 Google 电子表格
我收到了 4 个不同的采购订单，上面有一个随机的采购订单编号。我仅在 A 列中填写采购订单号。对于这个例子，我收到了下面列出的 4 个不同的采购订单。采购订单 697533 - 2 项采购订单
Python，遍历 Excel 电子表格
我需要编写循环遍历数据列的程序。根据单元格值和代表变量的每一列重置变量。练习中的变量取决于循环的这些值。如何在循环的每次迭代中将值增加 1 来循环遍历行？ df=pd.DataFrame(r'C:
search - 如何搜索 Google 电子表格？
我正在做一些详尽的搜索，需要确定新域 (URL) 是否已经在电子表格中。但是，没有一个电子表格对象具有搜索功能，即在大多数文档对象中找到的 findText()。我觉得我错过了一些重要的东西。我错过
pandas - 导入带有用户格式表格的 Excel 电子表格
我正在尝试在 Pandas 中导入一个 excel 电子表格，但由于数据“由用户在视觉上构建”以在视觉上对用户友好并且没有使用正确的数据结构，因此我遇到了一些问题。结果，当在 Pandas 中作为数
javascript - Google 可视化多重查询(电子表格)
我必须在 HTML 页面上显示多个图表，但我无法进行多个查询(直接在 google 电子表格上)。实际上，我只是第一个查询显示的是谁。我的代码: Page de pilotage
javascript - 为什么我的单选按钮响应无法响应我的 Google 电子表格？
我使用以下代码作为将 html 网站上的用户输入数据发送到 Google 电子表格的方法: Javascript: function postContactToGoogle() { v
javascript - 如何从模板创建 Google 电子表格？
我有一个使用 Google Drive 和电子表格 API 的网站。我想要做的是，如果没有找到具有特定条件的电子表格，则在用户的 Google 云端硬盘上创建电子表格。该电子表格应该是我的 Googl
performance - 导入与链接到 Excel 电子表格
我目前链接到六个 Excel 电子表格，主要是因为用户在 Excel 中编辑数据更容易/更好(他们从未使用过 Access)，而且任何更改都会立即反射(reflect)，包括是否有新列添加后即可立即供
excel - 以编程方式将链接添加到 Excel 电子表格
我正在努力通过 PowerShell 添加指向可变长度电子表格的链接，无论如何我都会遇到错误。这是我目前正在尝试制作的循环，它嵌套在一个 excel comobject 中， $sheet 代表 $e
excel - 为什么并行代码不能写入 Excel 电子表格？
在 Excel 电子表格中编写许多工作表可能需要一段时间。并行化它会很有帮助。此代码运行良好，它使一个 Excel 电子表格在屏幕上弹出，其中包含四个名为 Sheet1、1、2 的工作表和 3。

首页

博学

6Ren·AI

商城

python - 在 Pandas 中加载通用的 Google 电子表格