python - 如何在 AI 平台培训中将 pandas-gbq 与 BigQuery Storage API 结合使用？-6ren

python - 如何在 AI 平台培训中将 pandas-gbq 与 BigQuery Storage API 结合使用？

转载作者：行者123 更新时间：2023-12-04 15:28:22

25

4

我正在向 GCP AI 平台培训服务提交培训作业。我的训练数据集(同一 GCP 项目中 BigQuery 表上的大约 4000 万行)需要在训练工作开始时作为 Pandas 数据框进行预处理，因此我尝试了 GCP documentation 提出的两种解决方案。 :

pandas_gbq API:pd.read_gbq(query, project_id=PROJECT, dialect='standard', use_bqstorage_api=True)
google-cloud-bigquery API:client.query(query).to_dataframe(bqstorage_client=bqstorage_client)

这两种方法都适用于 AI 平台笔记本虚拟机，可在几分钟内将整个 4000 万行数据集下载为 pandas 数据帧。我正在努力在 AI 平台训练服务器(在 n1-highmem-16 机器上运行)上复制相同的过程。在 pandas-gbq API 的情况下，我获得了一个权限被拒绝的错误:

google.api_core.exceptions.PermissionDenied: 403 请求失败:用户没有 'projects/acn-c4-crmdataplatform-dev' 的 bigquery.readsessions.create' 权限

对于 google-cloud-bigquery API，没有错误。

根据 GCP documentation 的建议，这是我所需的软件包列表，通过训练包中的setup.py文件传递给AI平台训练作业:

tensorflow==2.1.0
numpy==1.18.2
Pandas ==1.0.3
google-api-core==1.17.0
google-cloud-core==1.3.0
pyarrow==0.16.0
pandas-gbq==0.13.1
google-cloud-bigquery-storage==0.8.0
google-cloud-bigquery==1.24.0

最佳答案

你必须做两件事:

首先，检查服务帐户 service-<PROJECT_NUMBER>@cloud-ml.google.com.iam.gserviceaccount.com存在并具有 Cloud ML Service Agent角色。如果没有，请手动添加(您不必创建它!)
授予此服务帐号查询您的 BigQuery 数据集的权限。

关于python - 如何在 AI 平台培训中将 pandas-gbq 与 BigQuery Storage API 结合使用？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/61798710/

25

4

0

文章推荐： r - 如何在 R 中绑定(bind)子列表

文章推荐： angular - 存储 Observable 的解析值，以便在模板中多次使用

文章推荐： postgresql - 在 psql 中为 Postgres 函数体访问\设置变量

文章推荐： ios - 同时在 iPhone 上安装 iOS 应用程序的生产和开发版本

Talend 培训/教程
就目前而言，这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持，但这个问题可能会引起辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开，visit the he
ocr - Tesseract 培训 - 只有数字的新字体
您好，我尝试根据以下数字为新字体训练 tesseract: 所有数字都在具有透明背景的 png 文件中提供。如果我从它创建一个盒子文件，训练它等等 - 一切正常! 现在的问题，同样的情况，但我想根据下
iphone - 培训 iPhone 开发人员
关闭。这个问题是opinion-based 。目前不接受答案。想要改进这个问题吗？更新问题，以便 editing this post 可以用事实和引文来回答它。 . 已关闭10 年前。 Improv
android - 隐藏导航栏 - Android 培训
我目前正在接受 Android 培训，因为我正在尝试正确隐藏导航栏。在training documentation它指出: You can hide the navigation bar on And
python - Gensim Doc2Vec 培训
我正在使用 gensim 在分配给特定人员的文档上训练 Doc2Vec 模型。有1000万份文件和8000人。我不关心所有 8,000 人。我关心特定的人群(比如 1 到 500 人)。我感兴趣的人
algorithm - 无法解决作业(ACM-培训)
我不知道如何解决这个问题: http://acm.sgu.ru/problem.php?contest=0&problem=311 请帮我解决这个问题我知道它可以用线段树来解决，但我不知道如何最佳
multithreading - 多线程 AForge.NET 培训
我正在使用 AForge.NET ANN 并在我的训练集上对其进行训练。因为训练是单线程的，而且这个过程可能需要很长时间，我想知道是否可以运行多线程训练。因为在训练弹性反向传播网络时使用线程是一个问
javascript - JavaScript/JSON 培训 Material
有人知道一个好的教程/文章/任何东西可以帮助我解释 JavaScript(重点是 JSON)吗？我想教新的团队成员什么是 JSON 以及如何有效地应用它，但我不是试图重新发明轮子(并且可能做错了)，
python - child 数据库的 Dlib 培训
我正在尝试使用 Dlib 训练人脸检测器。我选择了近 1000 张图像进行训练。根据文档，我使用该图像创建了 training_with_face_landmarks.xml。但是，我不明白， tes
c - 德语维基百科上的 Word2vec C++ 培训
我正在使用 C 版本的 word2vec(在 https://code.google.com/archive/p/word2vec/ 中找到)并在德语版维基百科的过滤转储(约 17 GB 原始文本，约
algorithm - 无痛 'Analysis of Algorithms' 培训？
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题，以便用事实和引用来回答。关闭 6 年前。
perl - 什么是对非 Perl 开发人员的有效 Perl 培训？
关闭。这个问题是opinion-based .它目前不接受答案。想改进这个问题？更新问题，以便 editing this post 可以用事实和引用来回答它. 8年前关闭。 Improve this
OpenNLP NameFinder 培训， "Found unexpected annotation"
在训练我的 NameFinderME 时，我收到以下错误消息: 我的数据如下: some text Computing event counts... java.io.IOException: F
java - C# 上的 OpenNLP NameFinder 培训
我想使用 C# 在 OpenNLP 中训练一个新模型。我在java部分使用了IKVM。这是我的火车的方法:(我在jv中引用了java.io，在op中引用了open.tools) public str
java - USACO 培训 – 文本提交给我一个错误 : "Error:_Main_method_not_found_in_class_test"
我正在处理 USACO 培训页面的第一个问题，它要求您提交一个简单的解决方案。虽然我的代码可以在 IDE 上编译，但 USACO 评分器给我一个错误，说找不到 main。 Run 1: Executi
c - 磁带平衡 Codility 培训 : Why Does It Return 0?
***我不是在寻找解决方案帖子我正在参加 C 语言的 Tape Equilibrium Codility 培训，这就是我所取得的进展: // you can write to stdout for
mysql - 低成本在线 SQL 或 mySQL 培训？
已关闭。此问题不符合Stack Overflow guidelines 。目前不接受答案。要求我们推荐或查找工具、库或最喜欢的场外资源的问题对于 Stack Overflow 来说是偏离主题的，因为
16 位微 Controller 的 C 培训
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题，以便用事实和引用来回答。关闭 7 年前。
xml - 如何将包含文本文件的文件夹转换为 xml 文件以进行 haar 培训
我正在使用 opencv_haartrainaing 来训练我的级联分类器，我有一个文件夹，其中包含带有文本文件的子文件夹，而不是此处所示的 .xml 文件.... 如何获得最终的 .xml 文件？
c++ - 带一维数组的动态编程 USACO 培训 : Subset Sums
在解决 USACO 培训问题时，我发现了动态规划。处理这个概念的第一个训练问题是一个称为子集和的问题。问题陈述如下: 对于从 1 到 N(1 #include using namespace

首页

博学

6Ren·AI

商城

python - 如何在 AI 平台培训中将 pandas-gbq 与 BigQuery Storage API 结合使用？