hadoop - 当 Google 存储在属性中设置为位置时 MSCK 命令抛出错误-6ren

gpt4 book

didi

hadoop - 当 Google 存储在属性中设置为位置时 MSCK 命令抛出错误

转载作者：可可西里更新时间：2023-11-01 15:10:28

26

4

gpt4 key购买

nike

我有一个外部分区的配置单元表，其位置设置为“gs://xxxx”。我手动添加了一些分区，并且为了将这些分区注册到配置单元元存储，我运行了 MSCK REPAIR 命令，该命令抛出以下错误:

FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask

请告诉我为什么会产生这个错误

最佳答案

试试这个 -

set hive.msck.path.validation=ignore; MSCK REPAIR TABLE table_name;

如果它不起作用，请检查 DDL 和分区字段。请记住，仅支持 Int 和 String 作为分区值

关于hadoop - 当 Google 存储在属性中设置为位置时 MSCK 命令抛出错误，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/43062139/

26

4

0

文章推荐： http - accept_language检测国家的准确性

文章推荐： c++ - MacPorts gcc48 无法识别的命令行选项 '-stdlib=libc++'

文章推荐： http - 子域可以删除域 cookie 吗？

文章推荐： api - 需要帮助了解 REST API 端点

hadoop - 模式表的 MSCK 修复表失败
我的 hive 表名采用以下格式: schema_name.hive_table_name 例如:schema1.abc; 现在，当我尝试在上面的配置单元表上执行 MSCK 修复表时，它会抛出以下错误
hive - MSCK REPAIR hive 外部表
我每天都会将数据摄入到 HDFS 中。从数据到 HDFS，我生成按日期分区的 Hive 外部表。我的问题如下，我是否应该在每次数据摄取后运行 MSCK REPAIR TABLE tablename ，
hive - Athena 在 msck 修复表后不添加分区
我有一个将数据存储在 s3 中默认目录结构的消防水管: "YY/MM/DD/HH"和 athena 中的表，这些列定义为分区: 年:字符串，月:字符串，日:字符串，小时:字符串跑完后 msck re
hadoop - MSCK REPAIR TABLE 表名耗时较长
我在包含超过 28K 分区的配置单元表上运行 MSCK REPAIR TABLE 表名，我们将每 10 分钟接收一个分区。当我们每 10 分钟在此表上运行一次 MSCK REPAIR TABLE 时
pyspark - Athena 仅更新特定分区 : MSCK REPAIR TABLE
我有一个外部表，其中包含按日期分区的数据。对于当天的新文件集，数据每天都会更新。这就是我在气流中执行工作的方式。获取文件。这会在 S3 上获取类似 dt=2018-06-20 的文件。通过 dt
hadoop - 当 Google 存储在属性中设置为位置时 MSCK 命令抛出错误
我有一个外部分区的配置单元表，其位置设置为“gs://xxxx”。我手动添加了一些分区，并且为了将这些分区注册到配置单元元存储，我运行了 MSCK REPAIR 命令，该命令抛出以下错误: FAILE
hive 0.13 msck 修复表仅列出不在 Metastore 中的分区
我正在尝试使用 Hive(0.13) msck repair table命令来恢复分区，它只列出未添加到 Metastore 的分区，而不是将它们也添加到 Metastore。这是命令的输出 par
hive - HDINSIGHT 配置单元，MSCK 修复表 table_name 抛出错误
我有一个名为employee 的外部分区表，带有partition(year,month,day)，每天都会有一个新文件出现在特定的日期位置调用今天的日期，它将在2016 年10 月13 日。 TAB
apache-spark - 外部 Hive 表刷新表与 MSCK 修复
我将外部配置单元表存储为 Parquet，按列分区，例如 as_of_dt并通过 Spark 流插入数据。现在每天都会添加新分区。我在做msck repair table以便 hive Metast
amazon-athena - Athena MSCK 修复表返回 'tables not in metastore'
运行 MSCK repair tablename 命令时，athena查询编辑器返回错误 tables not in metastore . 但是表存在，我可以在该表上查询。我有数据保存在 S3形式
hadoop - MSCK REPAIR TABLE 显示无错误，但未检测到任何分区
我对 HIVE 环境非常陌生。我正在尝试在带有分区的配置单元中创建一个外部表。例如，只有两个分区: 我创建了一个外部表: CREATE EXTERNAL TABLE test (col1 INT,
hadoop - Apache hive MSCK REPAIR TABLE 未添加新分区
我是 Apache Hive 的新手。在处理外部表分区时，如果我直接向 HDFS 添加新分区，则在运行 MSCK REPAIR 表后不会添加新分区。以下是我试过的代码， -- 创建外部表 hive>
amazon-web-services - AWS Athena MSCK REPAIR TABLE对于小型数据集而言花费的时间太长
我在使用Amazon Athena时遇到问题，我有一个带有4个分区级别的小存储桶(36430对象，9.7 mb)(my-bucket/p1 = ab/p2 = cd/p3 = ef/p4 = gh/f
amazon-web-services - MSCK REPAIR TABLE 在幕后做了什么，为什么它这么慢？
我知道MSCK REPAIR TABLE使用外部表的当前分区更新元存储。要做到这一点，你只需要做 ls在表的根文件夹上(假设表仅由一列分区)，并获取其所有分区，显然是 < 1s 的操作。但在实际操
hive - AWS 雅典娜 : does `msck repair table` incur costs?
我在 S3 中有 ORC 数据，如下所示: s3://bucket/orc/clientId=client-1/year=2017/month=3/day=16/hour=20/ s3://bucke
apache-spark - Pyspark 中是否有等效于 SQL 的 MSCK REPAIR TABLE 的方法
在 SQL 中有: REFRESH TABLE table_name 在 pyspark 中相当于: spark.refreshTable(table_name) 那么，Pyspark 相当于: MS
amazon-web-services - AWS 更新雅典娜元 : Glue Crawler vs MSCK Repair Table
当新分区添加到 Athena 表时，我们可以使用 Glue Crawler 或 MSCK REPAIR TABLE 来更新元信息。他们的成本是多少？哪一个是首选？最佳答案 MSCK REPAIR T

可可西里

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

滴滴打车优惠券

全站热门文章

Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com