- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在尝试使用 BigQuery 包与 Pandas DataFrames 进行交互。在我的场景中,我查询 BigQuery 中的基表,使用 .to_dataframe(),然后将其传递给 load_table_from_dataframe() 以将其加载到 BigQuery 中的新表中。
我最初的问题是 str(uuid.uuid4()) (对于随机 ID)被自动转换为字节而不是字符串,所以我强制使用模式而不是允许它自动检测要做什么。
但是现在,我通过包含架构的 job_config 字典传递了 job_config,现在我收到此错误:
File "/usr/local/lib/python2.7/dist-packages/google/cloud/bigquery/client.py", line 903, in load_table_from_dataframe
job_config.source_format = job.SourceFormat.PARQUETAttributeError: 'dict' object has no attribute 'source_format'
我已经安装了 PyArrow,并尝试安装 FastParquet,但它没有帮助,而且在我尝试强制模式之前这并没有发生。
有什么想法吗?
https://google-cloud-python.readthedocs.io/en/latest/bigquery/usage.html#using-bigquery-with-pandas
查看实际的包,它似乎强制使用 Parquet 格式,但就像我说的,我之前没有问题,只是现在我正在尝试提供表架构。
编辑:只有当我尝试写入 BigQuery 时才会发生这种情况。
最佳答案
想通了。在清理了 Google 的文档后,我忘记了:
load_config = bigquery.LoadJobConfig()
load_config.schema = SCHEMA
哎呀。从未从 BigQuery 包加载配置字典。
关于python - Google Cloud BigQuery load_table_from_dataframe() Parquet AttributeError 错误,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51013943/
我正在尝试使用 BigQuery 包与 Pandas DataFrames 进行交互。在我的场景中,我查询 BigQuery 中的基表,使用 .to_dataframe(),然后将其传递给 load_
当我将数值数据(int64 或 float64)从 Pandas 数据帧上传到 “Numeric” Google BigQuery 数据类型时,出现以下错误: pyarrow.lib.ArrowInv
我是一名优秀的程序员,十分优秀!