hadoop - Spark SQL 不返回 HDP 上 HIVE 事务表的记录-6ren

hadoop - Spark SQL 不返回 HDP 上 HIVE 事务表的记录

转载作者：可可西里更新时间：2023-11-01 16:06:45

27

4

我在 HDP 设置上遇到了这个问题，事务表只需要一次压缩就可以使用 Spark SQL 获取记录。另一方面，Apache 设置甚至不需要压缩一次。

可能是压缩后在元存储上触发了某些东西，Spark SQL 开始识别增量文件。

如果需要其他详细信息来找出根本原因，请告诉我。

试试这个，

查看完整场景:

hive> create table default.foo(id int) clustered by (id) into 2 buckets STORED AS ORC TBLPROPERTIES ('transactional'='true');
hive> insert into default.foo values(10);

scala> sqlContext.table("default.foo").count // Gives 0, which is wrong because data is still in delta files

#Now run major compaction:

hive> ALTER TABLE default.foo COMPACT 'MAJOR';

scala> sqlContext.table("default.foo").count // Gives 1

hive> insert into foo values(20);

scala> sqlContext.table("default.foo").count // Gives 2 , no compaction required.

最佳答案

Spark 不支持 hive 的跨国表的任何特性。

请检查:https://issues.apache.org/jira/browse/SPARK-15348

关于hadoop - Spark SQL 不返回 HDP 上 HIVE 事务表的记录，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/35955666/

27

4

0

文章推荐： hadoop - 如何使用 apache pig 构建非结构化数据

文章推荐： Python:使用 cherrypy 通过 POST 发送和接收大文件

文章推荐： java - 将 Apache Pig 连接到 Hadoop 集群

apache-nifi - 如何将 nifi 流从一个 HDP 导出和导入到另一个 HDP
我正在使用 HDP 2.5 和 NiFI-1.1.0.2.1.2.0。谁能告诉我如何将 nifi 流从一个 HDP 导出和导入到另一个 HDP 最佳答案 NiFi可以通过模板导出/导入流。您可以将流程
hadoop - HDP 从 HDP 当前版本升级到 2.6.4 失败 - 2.6.0.3
我们有 ambari 集群版本 - 2.5.0.3(有 3 个主节点和 3 个工作节点) 我们正在从 HDP 版本 2.6.0.3 升级到 2.6.4 版本最后阶段安装失败出现在 - Finali
hadoop - HDP 集群中心跳丢失
我正在使用 10 个节点的 HDP 集群，其中 10 个节点中的一个在几个小时内重新启动，正如 Linux 管理员所建议的那样，我们已经重新部署了该特定节点。该节点由 Zookeeper server
hdp - 在 Atlas 实体之间添加关系的简单示例？
使用 REST API 在 apache atlas 中添加实体之间的关系的正确方法是什么？看着docs对于 REST API，我发现很难说出某些字段的含义，哪些字段是必需的(以及如果不输入会发生什么
hadoop - Hortonworks数据平台(HDP)的后端
我正在研究Hortonworks(Hortonworks数据平台)的后端以及Ambari，用于管理hadoop集群。现在我对这里的后端感到困惑。 HDP后端意味着使用Kerberos设置LDAP /
docker - Hortonworks HDP docker如何公开端口
首先，如果我要问一个明显的问题，我会提前道歉。我正在尝试公开 Hortonworks HDP docker(版本 2.6.5)端口，以便可以通过网络访问 Ambari UI 和打包的所有功能。我关注
java - 解析从蓝牙 HDP 设备接收到的原始数据
我正在尝试从欧姆龙 708-BT 血压监测仪读取数据，该监测仪已通过 continua 健康联盟认证。我正在关注这个例子 of a Bluetooth HDP App .我设法连接到设备并以字节格式检
hadoop - Ambari + HDP 许可
我正在经历一个Hadoop集群的部署和管理，我发现，对于这个目的，Ambari是一个非常有用和方便的工具。现在我想弄清楚 HDP 堆栈的所有许可证是否也允许在生产环境中部署 Hadoop 安装。有
cloudera - 哪个发行版 CDH 与 HDP
我碰巧在 CDH 工作了很长时间(大约 1 年)，并计划重新开始。现在我们有 CDH、HDP 和 Hortonwork 被 Cloudera 收购。 HDP 是否正在积极开发中？还是CDH正在积极开发
hadoop - HDP 2.2手动安装namenode格式-参数数量错误？
我正在从RPM在CentOS 6.5 64位上手动安装Hortonworks Data Platform 2.2。在格式化名称节点期间，“抛出”参数不足错误这些是根据手册的说明: Format an
hadoop - 在 HDP 上编译错误 Nutch
我刚开始使用nutch，昨天花了钱才弄清楚如何在我遇到的最新 HDP (2.3.2) vm 上运行 nutch 问题。直接构建源代码，一切顺利，但是在本地第一次运行之后，我遇到了 java.la
hadoop - HDP 2.5:Zeppelin无法在启用Kerberos的群集中运行Notebook
我使用Hortonworks Data Platform 2.5和Ambari 2.4设置了Hadoop集群。我还通过Ambari UI将Zeppelin服务添加到集群安装中。由于启用了Kerber
hadoop - Ambari HDP 2.4添加主机指标监视器无法安装
我试图将其他主机添加到运行HDP 2.4的Ambari群集中，并且Metrics Monitor似乎安装不正确，所有其他服务均正常运行。下面是尝试在其中一台新主机上启动Metrics Monitor
hadoop - 选择新的 HDP 版本进行升级后无法保存 - 这是一个错误吗？
我们执行以下步骤 - (来自 ambari GUI) 管理员 – 堆栈和版本 -> 版本管理版本确定注册版本注册版本我选择按钮“HDP-2.6”来添加新版本并浏览 VDF 文件——(VDF
hadoop - 是否可以在没有 Ambari 的情况下设置单节点 HDP？
我正在尝试在运行 CentOS 7 操作系统的虚拟机中设置单节点 HDP 安装。是否可以在没有 Ambari 的情况下进行设置？或者这是一个硬性的先决条件？我正在寻找安装 HDP 3.1。谢谢!
hadoop - 将Pivotal HD升级到Pivotal/Hortonworks HDP
鉴于Pivotal HD已经停产，并且Pivotal现在建议升级到Hortonworks HDP，因此我试图了解升级过程。由于Pivotal HD使用Ambari作为管理器，因此我们可以使用Horto
machine-learning - HDP(分层狄利克雷过程)能否从数据中检测到主题的数量？
我正在使用 gensim 主题建模软件中的 HDP(分层 Dirichilet 过程)包。 Gensim HDP 实现期望用户提前提供主题数量 (T)。 hdpmodel.HdpModel( self
ios - iOS 中的健康设备配置文件 (HDP) 支持
iOS 是否支持 HDP(健康设备配置文件)？有可用的示例吗？最佳答案 iOS 不支持蓝牙 2.1 的 HDP。它可以使用蓝牙 4.0 LE (CoreBluetooth) 连接到任何设备，但您实际
linux - 使用本地存储库的 Ambari 蓝图安装 (HDP)
我已经创建了 HDP & HDP-UTILS-1.1.0.21 内部存储库映射如下: curl -H "X-Requested-By: ambari" -X PUT -u admin:admin ht
linux - yum 删除干净卸载 HDP 期间的问题
如 this 等几个链接中所述和 this ，我正在尝试清理卸载 Hortonworks 2.2 数据平台。在 Linux 中天真，我面临着第一步本身的问题 - 删除已安装的 HDP 包。 [roo

首页

博学

6Ren·AI

商城

hadoop - Spark SQL 不返回 HDP 上 HIVE 事务表的记录