pandas - 从本地 Jupyter 笔记本访问 Google BigQuery 数据-6ren

pandas - 从本地 Jupyter 笔记本访问 Google BigQuery 数据

转载作者：行者123 更新时间：2023-12-02 09:42:48

25

4

我已经准备了一些笔记本并正在 DataLab 上使用。出于各种原因，我希望从我的计算机上的本地 Jupyter 笔记本访问相同的数据。

This question建议了一些到目前为止我无法工作的方法。

特别是 Gcloud 库:

from gcloud import bigquery
client = bigquery.Client()

给我一个堆栈跟踪，其中最后一行:

ContextualVersionConflict: (protobuf 2.6.1 (/usr/local/lib/python2.7/dist-packages), Requirement.parse('protobuf!=3.0.0.b2.post1,>=3.0.0b2'), set(['gcloud']))

Pandas 库看起来很有前途:

df=pd.io.gbq.read_gbq('SELECT CCS_Category_ICD9, Gender, Admit_Month FROM [xxxxxxxx-xxxxx:xxxx_100MB_newform.xxxxxx_100MB_newform]ORDER by CCS_Category_ICD9',
                 project_id='xxxxxxxx-xxxxx')

还给我一个堆栈跟踪:

IOError: [Errno 2] No such file or directory: '/usr/local/lib/python2.7/dist-packages/httplib2-0.9.1.dist-info/METADATA'

尽管我的浏览器当前已通过该项目的身份验证，但也许我在 Pandas 方法上存在身份验证问题？或者我缺少依赖项？

任何建议或指导表示赞赏..

从本地 Jupyter 笔记本访问 BigQuery 数据源的最佳方式是什么？

最佳答案

根据 gbq.read() 的错误，看来 httplib2 可能未正确安装。关于 Pandas installation page ，有一些可选的依赖项是 Google BigQuery 支持所必需的(httplib2 就是其中之一)。要重新安装/修复安装，请尝试:

pip install httplib2 --ignore-installed

安装 Google BigQuery 支持的可选依赖项后，以下代码应该可以运行:

from pandas.io import gbq
df = gbq.read_gbq('SELECT * FROM MyDataset.MyTable', project_id='my-project-id')

关于pandas - 从本地 Jupyter 笔记本访问 Google BigQuery 数据，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/37284435/

25

4

0

文章推荐： apache - .htaccess 重定向到外部 URL，同时隐藏重定向

文章推荐： winapi - 有没有办法丢弃APC队列？

文章推荐： memory - VirtualAlloc MEM_COMMIT 和 MEM_RESERVE

jupyter-notebook - pip install jupyter 后找不到 jupyter
在尝试安装 jupyter 的许多不同方法之后，它似乎没有正确安装。根据我最近遇到的 MacOS 系统 python 问题，可能与 MacOS 相关 pip install jupyter --us
jupyter - Jupyter 笔记本的更好命名约定
命名 Jupyter Notebook 时，如果使用空格，即 This is my notebook.ipynb 然后，当使用网络浏览器打开时，它的渲染效果非常好。然而，空格在命令行环境中是有害的。但
jupyter-notebook - `jupyter notebook` 和 `jupyter server` 有什么区别？
运行 jupyter notebook和 jupyter server给我非常相似的结果，描述也非常相似。 ❯ jupyter notebook -h The Jupyter HTML Noteboo
jupyter-notebook - Jupyter Lab 中的 Jupyter Notebook 扩展
是否可以在 Jupyter Lab 中使用笔记本扩展 (nbextensions)？我认为我的扩展已启用...我调用 jupyter nbextension enable事先在他们身上。但我没有在
python - Jupyter 命令仅适用于破折号(例如 jupyter-kernelspec 而不是 jupyter kernelspec)
我将 Jupyter 与 Anaconda3 结合使用。我的 Anaconda3\ 和 Anaconda3\Scripts\ 文件夹已添加到 %PATH% 变量中。尽管 jupyter.exe 位
jupyter - 在页面刷新时运行 Jupyter 单元格
我将 Jupyter 用于我公司的分析。我想制作显示一些漂亮图表的实时页面。我将在大厅的大显示器上显示此页面，我希望它自动刷新。有什么方法可以通过刷新浏览器页面来触发“运行所有单元格”吗？或者，是否
jupyter - %stored Jupyter 文件位于何处？
%store 魔术功能可以保存大型 python 对象，供您在不同 session 之间使用，但我想找出文件的实际位置，以便我也可以在不同 session 之间传输它们不同的电脑。我正在使用 Wind
jupyter-notebook - Jupyter 笔记本上的文本从右到左对齐
我在 Windows 10 的本地 Ubunto 机器上运行 Jupyter notebook。问题是所有文本都与屏幕右侧对齐，包括菜单 - 例如"file"选项卡位于最右侧。以这种方式阅读文本非常困
jupyter-notebook - Jupyter Notebook取消注释的快捷方式
Closed. This question is not reproducible or was caused by typos。它当前不接受答案。想要改善这个问题吗？更新问题，以便将其作为on-t
jupyter-notebook - Jupyter 链接到部分
我尝试使用以下内容创建指向 jupyter 笔记本中标题的内部链接。 SO上的各种答案，例如here在我的笔记本中似乎没有按预期工作。下面的代码创建了一个链接，但在尝试访问该链接时没有任何 react
jupyter - 如何共享 Jupyter 笔记本
这个问题在这里已经有了答案: How can I share Jupyter notebooks with non-programmers? [closed] (6 个回答) 5年前关闭。我安装了一
jupyter-notebook - Jupyter 笔记本自动完成显示太多
我试图在 jupyter notebook 中自动完成路径。按“tab”后，它显示的不仅仅是文件夹或文件。我认为这些是python的内置功能。有没有办法在自动完成路径时只显示路径和文件？谢谢! 最佳
jupyter - 从控制台执行 Jupyter notebook
我在 Jupyter notebook 中组合了一些数据分析步骤。随着数据的变化，我希望能够重新运行所有单元格(以考虑新数据) 转换为html以供查看我知道我可以通过 jupyter nbcon
jupyter-notebook - jupyter 实验室中的自动单元格执行计时
在 jupyter 中笔记本 , 我可以用 nbextensions 配置自动单元计时，结果是这样的: 我怎样才能在 jupyter 中做到这一点实验室 ?我没有找到任何做类似事情的扩展。观察:
jupyter-notebook - 无法在受限数据处理设置中安装 JUPYTER
我正在寻找一个带有 Jupter 可选组件的数据处理集群。 gcloud beta dataproc clusters create cluster-1ea3 --enable-component-g
jupyter-notebook - Jupyter 笔记本自动完成显示重复选项
Jupyter Notebook 的自动完成功能似乎有效，但不知何故它会显示该方法的重复选项。例如下面: 对于每个可能的选项，下拉菜单将显示 2 个相同的选项。为什么会发生这种情况以及如何解决？最佳
jupyter-notebook - Jupyter 实验室不断开启简单模式
每当我将 jupyter 实验室窗口推到一边时，“简单模式”就会被激活。这导致只显示一个选项卡，而其他选项卡被隐藏。这非常烦人，我不敢相信这是一个标准功能(只是再次安装了 jupyter 实验室)。
jupyter-notebook - Jupyter Notebook新电池类型默认
当我使用jupyter notebook时，我希望新单元格的类型为“markdown”。默认情况下，新单元格的类型为“代码”。我应该修改哪个配置文件以及应该更改哪个变量？最佳答案转到您的pyt
jupyter - Jupyter 下的 Haskell
奇怪的是，互联网上没有关于如何在 Jupyter 环境下运行 Haskell 的说明。任何引导您实现此目的的文档都需要您从源代码编译，但是当尝试这样做时，会发生各种构建错误。奇怪的是，一个肯定会给
jupyter-notebook - Jupyter 中的非阻塞单元执行
在带有 ipython 内核的 Jupyter 中，是否有以非阻塞方式执行单元格的规范方法？理想情况下，我希望能够运行一个单元格 %%background time.sleep(10) print(

首页

博学

6Ren·AI

商城

pandas - 从本地 Jupyter 笔记本访问 Google BigQuery 数据