amazon-s3 - 既然QuickSight可以直接查询S3，那么什么时候我们需要使用Athena作为QuickSight的数据源呢？-6ren

amazon-s3 - 既然QuickSight可以直接查询S3，那么什么时候我们需要使用Athena作为QuickSight的数据源呢？

转载作者：行者123 更新时间：2023-12-03 00:00:15

25

4

可能我错过了一些东西，但我无法理解如果我将 Athena 与 QuickSight 连接而不是直接将 QuickSight 连接与 S3，我会得到什么好处。请帮助我理解这一点。

最佳答案

Amazon S3 是一种对象存储，旨在存储和检索任意数量的数据。基本上，它有一些原始数据或非结构化数据(采用某些文件格式.csv或.tsv)。

Amazon Athena uses a managed Data Catalog to store information and schemas about the databases and tables that you create for your data stored in Amazon S3. So, Athena knows about the data and its structure (i.e. some schema) in S3.

此外，QuickSight还可以直接连接Athena数据库并查询数据进行分析。当您连接到 Athena 数据库时，您最有可能处理结构化或半结构化数据。

当数据源是 Amazon Athena 时，不需要 Amazon S3 list 文件。

直接连接到 S3 时的一些限制:-

No file specified in the manifest can exceed 1 GB in size, the total size of the all the files specified can't exceed 10 GB, and the total number of files specified can't exceed 1000.

当您使用 Amazon Athena 数据创建数据集时，上述限制不可用。

使用 Amazon Athena 数据创建数据集时的另一个功能:-

You can directly analyze the data without loading or load into SPICE and analyze the data.

结论:-

如果您尚未对 S3 文件执行任何操作，则可以直接使用 QuickSight 使用 S3 作为数据集。

如果您已将 S3 数据加载到 Athena 中，则可以使用 Athena 作为 QuickSight 的数据集。

通过使用 Athena 或任何其他数据源，您将获得一些好处，并且可以克服上面提到的一些限制(即文件大小)。

关于amazon-s3 - 既然QuickSight可以直接查询S3，那么什么时候我们需要使用Athena作为QuickSight的数据源呢？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/47354233/

25

4

0

文章推荐： angularjs - statechangestart 阻止导航

文章推荐： Highcharts饼图获取所选饼图id

文章推荐： excel - 将共享文件夹路径转换为 UNC 路径

amazon-athena - Amazon athena 无法读取 S3 访问日志文件，Athena 选择查询为每一列返回空结果集
我在 Athena 中成功创建了数据库表。请参阅下面的查询。 CREATE EXTERNAL TABLE IF NOT EXISTS s3_access_logs_db.wafbucket_lo
amazon-athena - athena 跳过以下划线开头的键
我正在尝试与 aws athena 合作，对我们存储在 s3 中的 json 文件进行一些查询。所以，我设法创建了一个简单的模式，一切似乎都很好，直到我注意到我的一些文件没有被考虑在内。文件的键是用
amazon-athena - presto athena 表作为变量
这个问题在这里已经有了答案: AWS ATHENA: user-defined variables (4 个答案) 关闭去年。我在 aws-athena 中有一个 SQL，它看起来或多或少像这样
amazon-athena - 如何处理 Athena 结果文件？
刚接触 AWS，第一次使用 Athena。将不胜感激任何帮助/澄清。我将查询结果位置设置为 s3://aws-athena-query-results-{ACCOUNTID}-{Region}，无论
amazon-athena - Aws Athena - 创建外部表跳过第一行
我正在尝试使用 Aws Athena 在 csv 文件上创建一个外部表，代码如下，但行 TBLPROPERTIES ("skip.header.line.count"="1")不起作用:它不会跳过 c
amazon-athena - Amazon Athena 允许查看访问并拒绝表访问
我需要将表中的某些字段隐藏到特定用户组。我想到了创建一个查看这允许我屏蔽这些字段。但是，一旦将权限设置为仅授予对 View 的访问权限，查询就会失败，因为它们还需要访问在 View 下正在查询的表
amazon-athena - 为 athena 选择特定文件
在 Athena 中创建表时，我无法使用特定文件创建表。有没有办法从给定的存储桶中选择以“year_2019”开头的所有文件？例如 s3://bucketname/prefix/year_2019*.
amazon-athena - 在 Amazon Athena 中按顺序显示分区
我有这个查询: SHOW PARTITIONS tablename; 结果是: dt=2018-01-12 dt=2018-01-20 dt=2018-05-21 dt=2018-04-07 dt=2
amazon-athena - 在 Amazon Athena 中创建表时转换时间戳
我一直在使用以下查询在 Athena 中创建一个表， CREATE EXTERNAL TABLE IF NOT EXISTS test.test_table ( `converteddat
amazon-athena - 如何在 Presto (Athena) 中将字符串转换为时间戳？
我想将字符串的数据类型(例如:'2018-03-27T00:20:00.855556Z')转换为时间戳(例如:'2018-03-27 00:20:00')。实际上我在 Athena 中执行查询: s
amazon-athena - AWS Athena map 查询
该表有一列像这样， data MAP 和行喜欢， id | data 1 | {"foo": 123} 2 | {"bar": 456} 那么，如何搜索 data["bar"] = 456？我
amazon-athena - 在 Athena/Presto 中将数组拆分为列
我觉得这应该很简单，但我一直在努力寻找正确的术语，请耐心等待。我有两列，timestamp和 voltages这是数组如果我做一个简单的 SELECT timestamp, voltages FR
amazon-athena - Apache 超集 : cannot read metadata from Athena
我正在尝试从超集访问 Athena，连接成功并且可以在 SQL 编辑器中看到所有模式和表(启用在 SQL 实验室中公开此数据库)。在 SQL 编辑器上加载元数据时返回以下错误: ERROR OCCU
amazon-athena - AWS Athena ODI JDBC 连接
有没有人尝试过从 Oracle Data Integrator 连接 AWS Athena。我一直在尝试这个，但我找不到合适的 JDBC 连接字符串。我遵循的步骤 https://docs.aws
amazon-athena - Athena MSCK 修复表返回 'tables not in metastore'
运行 MSCK repair tablename 命令时，athena查询编辑器返回错误 tables not in metastore . 但是表存在，我可以在该表上查询。我有数据保存在 S3形式
amazon-athena - 如何通过 API 创建 Athena 数据库
我想通过 API 在 Athena 中创建一个数据库。我在 S3 中有 Parquet 文件，我想使用 API 进行查询，我想使用 Athena 进行查询。无论如何，我可以通过 Athena 的 A
amazon-athena - 从嵌套的 json 源创建 Athena 表
如何从嵌套的 json 文件创建 Athena 表？这是我的示例 json 文件。我只需要选定的键值对，例如 roofcondition 和 garagestalls。 { "reportId":
amazon-athena - 从嵌套的 json 源创建 Athena 表
如何从嵌套的 json 文件创建 Athena 表？这是我的示例 json 文件。我只需要选定的键值对，例如 roofcondition 和 garagestalls。 { "reportId":
amazon-athena - 如何提取存储在 amazon Athena 中的 XML 数据？
我在 Amazon Athena 中获得了一张表，其中一列包含 XML 数据。这可能不是最好的方法，但我需要利用现有的资源。据我所知，没有原生支持从这些 XML 中提取数据(比如使用 XPATH 等
amazon-athena - 在 AWS Athena 中查询嵌套的 JSON 结构
我得到了以下格式的带有嵌套结构的 JSON 文档 { "id": "p-1234-2132321-213213213-12312", "name": "athena to the re

首页

博学

6Ren·AI

商城

amazon-s3 - 既然QuickSight可以直接查询S3，那么什么时候我们需要使用Athena作为QuickSight的数据源呢？