azure - 从其他服务器的ORC文件创建Hive ORC表-6ren

azure - 从其他服务器的ORC文件创建Hive ORC表

转载作者：行者123 更新时间：2023-12-02 21:01:30

25

4

我们有2个群集，一个是Map R，另一个是我们自己的。我们希望使用Map R数据在自己的硬件中创建新的设置。

我已经复制了Map R群集中的所有orc文件，并遵循了相同的文件夹结构

创建了Orc格式的表，位置为＃1

然后执行此命令“MSCK REPAIR TABLE <>”

以上步骤顺利通过，但当我查询分区时，作业失败并显示以下错误

java.lang.IllegalArgumentException: Buffer size too small. size = 262144 needed = 4958903
    at org.apache.hadoop.hive.ql.io.orc.InStream$CompressedStream.readHeader(InStream.java:193)
    at org.apache.hadoop.hive.ql.io.orc.InStream$CompressedStream.read(InStream.java:238)

有人可以告诉我我们可以直接从orc文件创建HIVE ORC分区表吗？

我的存储是Azure数据湖。

最佳答案

根据您的描述，根据我的理解，我认为您想将所有orc文件从一个群集复制到另一个群集并将这些orc文件作为配置单元表加载。

为此，请尝试按照以下命令创建用于加载orcfile数据的外部表。

CREATE EXTERNAL TABLE IF NOT EXSISTS <table name> (<column_name column_type>, ...)
    ROW FORMAT SERDE 'org.apache.hadoop.hive.ql.io.orc.OrcSerde' 
    STORED AS ORC 
    LOCATION '<orcfile path>'

如果不知道orc文件的列列表，则可以引用Hive手册 ORC File Dump Utility 通过 hive --orcfiledump -j -p <location-of-orc-file-or-directory>以JSON格式打印ORC文件元数据。

关于azure - 从其他服务器的ORC文件创建Hive ORC表，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/43129022/

25

4

0

文章推荐： linux - xdebug phpstorm docker linux

文章推荐： clang - 如何从 github 源编译 memcached？

asp.net - 服务器.MapPath (".")，服务器.MapPath ("~")，服务器.MapPath(@"\")，服务器.MapPath ("/")。有什么不同？
谁能解释一下 Server.MapPath(".")、Server.MapPath("~")、Server.MapPath(@"之间的区别\") 和 Server.MapPath("/")？最佳答案
c# - 服务器.UrlEncode & 服务器.UrlDecode
我不知道，为什么我们要使用 Server.UrlEncode() & Server.UrlDecode()？!在 QueryString 中我们看到 URL 中的任何内容，那么为什么我们要对它们进行编
ssl - 服务器 SSL 不完整链(Inmotion 服务器)
我已经通过 WHM 在我的一个域上安装了 ssl 证书。网站正在使用 https://xyz.com . 但是它不适用于 https://www.xyz.com .我已经检查了证书，它也适用于 www
c++ - 如何在 C++ 中使用 WMI 或其他 WMI 检测安装在 Windows 2003 服务器和 2008 服务器 2003 服务器 R2 和 2008 服务器 R2 上的防病毒软件
我已经使用 WMI 检测操作系统上是否存在防病毒软件，itz 正常工作并通过使用命名空间向我显示防病毒信息，例如 win xp 和 window7 上的名称和实例 ID:\root\SecurityC
Hive 服务器 1 与 Hive 服务器 2
我们有 hive 0.10 版本，我们想知道是否应该使用 Hive Server 1 或 Hive Server2。另一个问题是连接到在端口 10000 上运行的 Hive 服务器，使用 3rd 方工
c++ - Windows Http 服务器 API HTTPS 服务器
我想在 C++ 中使用 Windows Server API 设置一个 HTTPS 服务器，我使用了示例代码，它在 HTTP 上工作正常，但我就是不能让它在 HTTPS 上工作。 (我不想要客户端 S
c# - smtpclient 不适用于 Exchange 服务器，但适用于 smtp 服务器
我写了一个非常基本的类来发送电子邮件。我用 smtp 服务器对其进行了测试，它工作正常，但是当我尝试使用我公司的交换服务器时，它给出了这个异常: SMTP 服务器需要安全连接或客户端未通过身份验证。服
delphi - DataSnap 服务器 - 将 HTTP 请求重定向到另一个 DataSnap 服务器
我的应用程序包含一个“网关”DataSnap REST 服务器，它是所有客户端的第一个访问点。根据客户端在请求中传递的用户名(基本身份验证)，请求需要重定向到另一个 DataSnap 服务器。我的问题
java - Servlet 适用于我的 Tomcat 服务器，但不适用于我的 Glassfish4 服务器
我有一个 Tomcat 服务器和一个 Glassfish4 服务器。我的 Servlet 在 Tomcat 服务器上启动得很好，但在 Glassfish4 服务器上给我一个“HTTP Status 4
linux - 无法从托管虚拟机(即我的 ubuntu 服务器)的计算机以外的其他计算机访问 ubuntu 服务器
我在 vmware 上创建了一个 ubuntu 服务器。我用它作为文件服务器。如果我通过托管虚拟机的计算机进行连接，则可以访问它。我无法从同一网络上的其他计算机执行此操作。提前致谢! 最佳答案首先确
ruby-on-rails - 重新启动 rails 服务器，分离 rails 服务器
如何重启 Rails 服务器？我从开始 rails server -d 所以服务器是分离的我知道的唯一方法就是去做ps 辅助 | grep rails 并 kill -9关于过程#但是像这样杀死进
XMPP 服务器 Vysper 与 OpenFire/Tigase(如何创建简单的 XMPP 服务器)
我实际上正在尝试找到编写一个简单的 XMPP 服务器的最佳方法，或者找到一个占用空间非常小的服务器。我只关心XMPP的核心功能(状态、消息传递、群组消息传递)。目前还在学习 XMPP 协议(proto
XMPP 服务器 Vysper 与 OpenFire/Tigase(如何创建简单的 XMPP 服务器)
我实际上正在尝试找到编写简单 XMPP 服务器的最佳方法，或者找到一个占用空间非常小的方法。我只关心 XMPP 的核心功能(统计、消息、组消息)。目前也在学习 XMPP 协议(protocol)，所以
java - 在 MobileFirst 服务器(Liberty 服务器)中使用 jax-ws
我们正在尝试从 Java JAX-RS 适配器访问 SOAP 1.1 Web 服务。我们正在使用从 WSDL 生成的 SOAP 客户端。但是当解码 SOAP 故障时，我们得到以下异常: ... C
Python 在代码中启动 HTTP 服务器(创建 .py 以启动 HTTP 服务器)
目前，我和许多其他人正在多个平台(Windows、OS X 和可能的 Linux)上使用 Python HTTP 服务器。我们正在使用 Python HTTP 服务器来测试 JavaScript 游戏
c# - C# 服务器(不是 Web 服务器)和 PHP 之间的数据交换
我有一个连续运行的服务器程序(C#/.NET 2.0 on Linux with mono)，我想从 PHP 脚本连接到它以在网站上显示状态信息。目的是创建一个(某种)实时浏览器游戏(无 Flash
facebook-graph-api - 应用 > OAuth2 服务器 > Facebook > OAuth2 服务器 > 应用
所以我有一个单页客户端应用程序。正常流程: 应用程序 -> OAuth2 服务器 -> 应用程序我们有自己的 OAuth2 服务器，因此人们可以登录应用程序并获取与用户实体关联的 access_t
msbuild - 升级 Web 服务器(服务器 2012 R2)后，Web 部署现在失败
我们刚刚将测试 Web 服务器从 Server 2008 升级到 Server 2012 R2。我们有一个部署我们网站的批处理脚本。当它将站点推送到服务器时，它现在失败了。奇怪的是，我可以使用相同的发
apache - 无法启动 SpagoBI 服务器(多合一 spagobi 服务器)版本 5.2
建议一些加载SpagoBI服务器的方法，我尝试了所有方法来解析spagobi服务器。在 Catalina 中，错误是 - * SEVERE: Unable to process Jar entry [
node.js - nodejs 服务器与 apache tomcat 服务器(App 服务器)有何不同？
当我们点击应用程序服务器(apache tomcat)时，它会创建一个线程来处理我们的请求并与 tomcat 连接，建立连接，tomcat 创建另一个线程来处理请求并将其传递给连接，连接线程将其传递给

首页

博学

6Ren·AI

商城

azure - 从其他服务器的ORC文件创建Hive ORC表