python - 使用 quip-api 和 pandas 阅读 Quip 电子表格-6ren

python - 使用 quip-api 和 pandas 阅读 Quip 电子表格

转载作者：行者123 更新时间：2023-12-04 08:19:02

32

4

我已经开始探索 Quip API。

我在 Quip 中创建了一个包含以下详细信息的电子表格:

添加了电子表格的标题
在电子表格中添加以下数据:

<表类="s-表"><头>id姓名<正文>1哈利2赫敏3罗恩

这是我尝试从 Quip 中读取的方式:

import quip
import pandas as pd
import numpy as np
import html5lib

client = quip.QuipClient(token, base_url = baseurl)
rawdictionary = client.get_thread(thread_id)

dfs=pd.read_html(rawdictionary['html'])
raw_df = dfs[0]
raw_df.drop(raw_df.columns[[0]], axis = 1, inplace = True) 
#raw_df.dropna(axis=0,inplace=True)
print(raw_df.replace(r'^\s+$', np.nan, regex=True))

我尝试用 nan 对象删除行，还尝试用 nan 替换空白字符串。但是，我仍然看到这些空行和列出现在数据框中，例如:

         A         B  C  D  E  F  G  H  I  J  K  L  M  N  O  P
0   id      name                            
1    1    harry                            
2    2  hermione                            
3    3  ron                            
4                                         
5                                         
6                                         
7                                         
8                                         
9                                         
10                                        
11                                        
12                                        
13                                        
14                                        
15                                        
16                                        
17

问题

通过 Python 阅读 Quip 电子表格的最佳方式是什么？
如何清理多余的行和列，并仅处理具有有效记录和标题的行作为 pandas 数据帧中的 id 和 name？
在我运行 print(raw_df) 时添加 raw_df.dropna(axis=0,inplace=True) 之后，我得到了 None 。为什么？

最佳答案

Quip 会自动拉入一些带有\u200b unicode 字符的额外空白列和行。

我是这样解决的:

import quip
import pandas as pd
import numpy as np
import html5lib

client = quip.QuipClient(token, base_url = baseurl)
rawdictionary = client.get_thread(thread_id)

dfs=pd.read_html(rawdictionary['html'])
raw_df = dfs[0]

raw_df.columns=raw_df.iloc[0] #Make first row as column header
raw_df=raw_df[1:] #After the above step, the 1st two rows become duplicate. Delete the 1st row.
raw_df=raw_df[attribs]
cleaned_df = raw_df.replace(np.nan, 'N/A')
cleaned_df = cleaned_df.replace('\u200b', np.nan) 
cleaned_df.dropna(axis=0,how='any',inplace=True)

关于python - 使用 quip-api 和 pandas 阅读 Quip 电子表格，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/65585084/

32

4

0

文章推荐： c++ - std::shared_ptr 线程安全

文章推荐： markdown - 为 reveal.js 演示文稿缩小字体大小和右对齐字体

java - 使用 google 电子表格 api 下载 google 电子表格
我这里有一个工作示例。 https://developers.google.com/google-apps/spreadsheets/我需要从用户的谷歌文档下载一些文件。 import com.goo
电子表格 |索引匹配 |
我需要您在以下方面的帮助: 假设我们有 3 个不同的组:(A、B、C) 我们在每个组中有几个值范围: (Eg. A has 0 - 100, 101 - 200 while B has 0 - 200
python +电子表格
谁能告诉我有什么方法可以从 python 连接到电子表格吗？我想从表单中存储一些数据并将其提交到谷歌电子表格。请帮助解决这个问题。我必须遵循哪些步骤？提前致谢... 最佳答案连接到 Google
电子表格 |使用日期的嵌套 IF 语句
我正在尝试计算 2019 年给定时间范围内的月数。我的数据如下所示: 我将开始日期和结束日期列的格式更改为“日期”。 “以月为单位的持续时间”和输出列具有数字格式。我接近它如下: 如果开始日期(年
grails 设计类和外部数据(电子表格)
在设计上有一点问题，希望我能在这里寻求建议。接受 grails 可能是完全错误的工具，但这就是生活。所以一直在努力开发一个网络应用程序，该应用程序基本上只是从谷歌电子表格中呈现大量信息并发回一些更新
python 网格控件/电子表格
我正在设计一个胖客户端(即非浏览器)Python 应用程序，它将与托管数据库进行通信。该应用程序的屏幕之一需要有一个网格/电子表格区域，允许显示多行数据、过滤、排序和更新多行信息。有人推荐一个具有此功
mysql - Django 电子表格
我在 Django 中有一个表单，可以将用户添加到 mySQL 数据库。然而，用户将不得不添加大量用户，并且一些信息将被复制和粘贴。所以我在想是否有一种方法可以有一个类似表单的电子表格，其中列标题是将
excel - 锁定 Excel 电子表格
我在 Outlook VBA 中编写了一个程序，它根据 Excel 电子表格的内容创建一些电子邮件。一切正常，但是当程序终止时，我继续运行“EXCEL.EXE”进程，该进程会锁定电子表格，因此其他人无
timezone - Google 电子表格 - 如何使用函数确定时区
如何使用公式来确定当前时区？我使用的公式给出了意想不到的结果。我的电子表格设置(文件 > 电子表格设置...): 时区: (GMT+01:00) 阿姆斯特丹我使用的公式: =TEXT(NOW()
excel - Google 电子表格 - 以持续时间格式转换总小时数
如何转换持续时间的小时数？示例:在单元格 A1 中，我有 176 . 我希望单元格 A2 有 176:00:00 我想在 176 小时(持续时间)内转换数字 176。那可能吗？因为如果我在单元格中键
excel - 条件格式 Google 电子表格
我收到了 4 个不同的采购订单，上面有一个随机的采购订单编号。我仅在 A 列中填写采购订单号。对于这个例子，我收到了下面列出的 4 个不同的采购订单。采购订单 697533 - 2 项采购订单
Python，遍历 Excel 电子表格
我需要编写循环遍历数据列的程序。根据单元格值和代表变量的每一列重置变量。练习中的变量取决于循环的这些值。如何在循环的每次迭代中将值增加 1 来循环遍历行？ df=pd.DataFrame(r'C:
search - 如何搜索 Google 电子表格？
我正在做一些详尽的搜索，需要确定新域 (URL) 是否已经在电子表格中。但是，没有一个电子表格对象具有搜索功能，即在大多数文档对象中找到的 findText()。我觉得我错过了一些重要的东西。我错过
pandas - 导入带有用户格式表格的 Excel 电子表格
我正在尝试在 Pandas 中导入一个 excel 电子表格，但由于数据“由用户在视觉上构建”以在视觉上对用户友好并且没有使用正确的数据结构，因此我遇到了一些问题。结果，当在 Pandas 中作为数
javascript - Google 可视化多重查询(电子表格)
我必须在 HTML 页面上显示多个图表，但我无法进行多个查询(直接在 google 电子表格上)。实际上，我只是第一个查询显示的是谁。我的代码: Page de pilotage
javascript - 为什么我的单选按钮响应无法响应我的 Google 电子表格？
我使用以下代码作为将 html 网站上的用户输入数据发送到 Google 电子表格的方法: Javascript: function postContactToGoogle() { v
javascript - 如何从模板创建 Google 电子表格？
我有一个使用 Google Drive 和电子表格 API 的网站。我想要做的是，如果没有找到具有特定条件的电子表格，则在用户的 Google 云端硬盘上创建电子表格。该电子表格应该是我的 Googl
performance - 导入与链接到 Excel 电子表格
我目前链接到六个 Excel 电子表格，主要是因为用户在 Excel 中编辑数据更容易/更好(他们从未使用过 Access)，而且任何更改都会立即反射(reflect)，包括是否有新列添加后即可立即供
excel - 以编程方式将链接添加到 Excel 电子表格
我正在努力通过 PowerShell 添加指向可变长度电子表格的链接，无论如何我都会遇到错误。这是我目前正在尝试制作的循环，它嵌套在一个 excel comobject 中， $sheet 代表 $e
excel - 为什么并行代码不能写入 Excel 电子表格？
在 Excel 电子表格中编写许多工作表可能需要一段时间。并行化它会很有帮助。此代码运行良好，它使一个 Excel 电子表格在屏幕上弹出，其中包含四个名为 Sheet1、1、2 的工作表和 3。

首页

博学

6Ren·AI

商城

python - 使用 quip-api 和 pandas 阅读 Quip 电子表格