maven - 通过 Shark API 查询不起作用-6ren

maven - 通过 Shark API 查询不起作用

转载作者：可可西里更新时间：2023-11-01 16:32:57

29

4

我正在尝试通过集群上的 Hive 表通过 Shark Java API 进行查询(简单选择)。

但是我收到此错误消息:

14/01/15 17:25:54 INFO cluster.ClusterTaskSetManager: Loss was due to java.lang.NoClassDefFoundError
java.lang.NoClassDefFoundError: Could not initialize class com.google.common.cache.CacheBuilder
at org.apache.hadoop.hdfs.DomainSocketFactory.<init>(DomainSocketFactory.java:46)
at org.apache.hadoop.hdfs.DFSClient.<init>(DFSClient.java:456)
at org.apache.hadoop.hdfs.DFSClient.<init>(DFSClient.java:410)
at org.apache.hadoop.hdfs.DistributedFileSystem.initialize(DistributedFileSystem.java:128)
at org.apache.hadoop.fs.FileSystem.createFileSystem(FileSystem.java:2308)
at org.apache.hadoop.fs.FileSystem.access$200(FileSystem.java:87)
at org.apache.hadoop.fs.FileSystem$Cache.getInternal(FileSystem.java:2342)
at org.apache.hadoop.fs.FileSystem$Cache.get(FileSystem.java:2324)
at org.apache.hadoop.fs.FileSystem.get(FileSystem.java:351)
at org.apache.hadoop.fs.Path.getFileSystem(Path.java:194)
at org.apache.hadoop.mapred.LineRecordReader.<init>(LineRecordReader.java:105)
at org.apache.hadoop.mapred.TextInputFormat.getRecordReader(TextInputFormat.java:67)
at org.apache.spark.rdd.HadoopRDD$$anon$1.<init>(HadoopRDD.scala:93)
at org.apache.spark.rdd.HadoopRDD.compute(HadoopRDD.scala:83)
at org.apache.spark.rdd.HadoopRDD.compute(HadoopRDD.scala:51)
at org.apache.spark.rdd.RDD.computeOrReadCheckpoint(RDD.scala:237)
at org.apache.spark.rdd.RDD.iterator(RDD.scala:226)
at org.apache.spark.rdd.MappedRDD.compute(MappedRDD.scala:29)
at org.apache.spark.rdd.RDD.computeOrReadCheckpoint(RDD.scala:237)
at org.apache.spark.rdd.RDD.iterator(RDD.scala:226)
at ....

接着是这个错误:

14/01/15 17:25:54 INFO cluster.ClusterTaskSetManager: Loss was due to java.lang.IncompatibleClassChangeError
java.lang.IncompatibleClassChangeError: class com.google.common.cache.CacheBuilder$3 has interface com.google.common.base.Ticker as super class
at java.lang.ClassLoader.defineClass1(Native Method)
at java.lang.ClassLoader.defineClass(ClassLoader.java:800)
at java.security.SecureClassLoader.defineClass(SecureClassLoader.java:142)
at java.net.URLClassLoader.defineClass(URLClassLoader.java:449)
at java.net.URLClassLoader.access$100(URLClassLoader.java:71)
at java.net.URLClassLoader$1.run(URLClassLoader.java:361)
at java.net.URLClassLoader$1.run(URLClassLoader.java:355)
at java.security.AccessController.doPrivileged(Native Method)
at java.net.URLClassLoader.findClass(URLClassLoader.java:354)
at java.lang.ClassLoader.loadClass(ClassLoader.java:425)
at sun.misc.Launcher$AppClassLoader.loadClass(Launcher.java:308)
at java.lang.ClassLoader.loadClass(ClassLoader.java:358)
at com.google.common.cache.CacheBuilder.<clinit>(CacheBuilder.java:207)
at org.apache.hadoop.hdfs.DomainSocketFactory.<init>(DomainSocketFactory.java:46)
at org.apache.hadoop.hdfs.DFSClient.<init>(DFSClient.java:456)
at org.apache.hadoop.hdfs.DFSClient.<init>(DFSClient.java:410)
at org.apache.hadoop.hdfs.DistributedFileSystem.initialize(DistributedFileSystem.java:128)
at org.apache.hadoop.fs.FileSystem.createFileSystem(FileSystem.java:2308)
at org.apache.hadoop.fs.FileSystem.access$200(FileSystem.java:87)
at org.apache.hadoop.fs.FileSystem$Cache.getInternal(FileSystem.java:2342)
at org.apache.hadoop.fs.FileSystem$Cache.get(FileSystem.java:2324)
at org.apache.hadoop.fs.FileSystem.get(FileSystem.java:351)
at org.apache.hadoop.fs.Path.getFileSystem(Path.java:194)
at org.apache.hadoop.mapred.LineRecordReader.<init>(LineRecordReader.java:105)
at org.apache.hadoop.mapred.TextInputFormat.getRecordReader(TextInputFormat.java:67)
at org.apache.spark.rdd.HadoopRDD$$anon$1.<init>(HadoopRDD.scala:93)
at org.apache.spark.rdd.HadoopRDD.compute(HadoopRDD.scala:83)
at org.apache.spark.rdd.HadoopRDD.compute(HadoopRDD.scala:51)
at org.apache.spark.rdd.RDD.computeOrReadCheckpoint(RDD.scala:237)
at org.apache.spark.rdd.RDD.iterator(RDD.scala:226)

这似乎是 Guava 依赖项的问题，但我无法弄清楚问题是什么。

我正在使用 Spark-0.8.0、Shark-0.8.0、Hive-0.9.0 和 Hadoop-4.5.0。

我的 .pom 文件中唯一需要 Guava 的依赖项是:

<dependency>
        <groupId>org.apache.spark</groupId>
        <artifactId>spark-core_2.9.3</artifactId>
        <version>0.8.0-incubating</version>
</dependency>
<dependency>
        <groupId>org.apache.hadoop</groupId>
        <artifactId>hadoop-client</artifactId>
        <version>2.0.0-cdh4.5.0</version>
</dependency>
<dependency>
        <groupId>org.apache.hive</groupId>
        <artifactId>hive-exec</artifactId>
        <version>0.9.0</version>
</dependency>

有谁知道如何解决这个问题？

谢谢。

最佳答案

您引用的所有三个依赖项都依赖于不同版本的 Guava。

spark-core_2.9.3使用 Guava 14.0
hadoop-client使用 Guava 11.0.2
hive-exec使用 Guava r09

看起来 Hadoop 正在寻找 Guava 的 CacheBuilder , 在 10.0 中添加，但 Hive (r09) 的版本必须优先。

我的建议是使用 Maven 的 dependency exclusions以防止 Maven 通过 Hive 从导入 Guava。您可能还想将它从 Hadoop 中排除，这样您就可以确定使用的是三个 (14.0) 中的最新版本。

关于maven - 通过 Shark API 查询不起作用，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/21141872/

29

4

0

文章推荐： hadoop - Namenode如何决定在哪个datanode中写入一个 block

文章推荐： apache - Docker 在子域上运行

maven - Maven 模块和 Maven 项目有什么区别
我试图理解 Maven 模块和 Maven 项目之间的区别。哪一个是什么以及我应该在哪里？谢谢最佳答案 maven 模块就像一个 maven“子项目”。一个 Maven 项目包含 1 个或多个模块。
maven - 如何从 Maven 构建手动更新 Maven 存储库？
我们目前没有自己的存储库。因此，当我们使用 Maven 构建时，它会在当前用户的主目录中创建 .m2 存储库。现在有两个在 Maven Central 中找不到的第三方 jar。假设其中之一是 ha
maven - 在没有 Maven 的情况下构建 Maven 项目
我有 Maven 项目，但在其中一台服务器上我必须在没有 Maven 的情况下构建它。可以使用标准 JDK 命令。在哪里可以看到 Maven 在构建项目时向 JDK 发送了哪些命令？最佳答案 Ma
maven - Maven 中的 ImageJ Maven 依赖项是中央的吗？
我打算将 ImageJ 用于 web 应用程序，但似乎 ImageJ maven 依赖项不在中央 maven 存储库中。我说得对吗？当 ImageJ 2.x 发布时，这会改变吗？最佳答案您可以
maven - 我可以在 maven 2 和 maven 3 之间共享一个 maven 存储库吗
我可以有多个 Maven 实例吗，即 Mave 2.2.1 和 Maven 3 都指向同一个本地存储库？我的意思是我知道我可以在技术上将每个 settings.xml 指向同一个文件夹，但从长远来看
maven - 使用不同的 Maven 配置文件更改 Maven 依赖项的版本
我有两个项目，项目 A 依赖于项目 B，所以通常，我的 projectA/pom.xml 中有以下部分: projectB blabla version1 我想要实现的目标非常简
maven - 核心 Maven 插件是否与 Maven 本身处于相同的发布周期？
在网上的许多地方，我看到它讨论了要使 maven 构建可重现，明确指定所有使用的插件的版本号很重要，这样更新的插件就不会破坏构建。推荐的方法似乎是使用 enforcer 插件。下面是我在网上找到的复制
maven - 有没有办法在 maven 中捕获用户输入并将其分配给 maven 属性？
有没有办法暂停 Maven 执行流程以提供命令提示符，以便用户可以输入文本。然后我希望将提供的文本存储在 Maven 属性中。如果用户输入可以被屏蔽，那将是一个奖励。这对于避免在 pom.xml
maven - maven Build Helper Maven Plugin的使用
我正在尝试使用 maven 插件将 maven java 项目的源文件夹添加到 Eclipse。尝试使用 org.codehaus.mojo 插件时，我收到以下错误无法在项目应用程序框架上执行目标
maven - 一个 Maven 配置文件可以从另一个 Maven 配置文件继承吗？
我有两个几乎相同的配置文件。我不想在每个配置文件中复制配置，而是希望一个配置文件从另一个配置文件“继承”，但我没有看到使用 maven 3 执行此操作的明显方法。在 Maven 中是否可以继承配置文
maven - 如何在多模块 Maven 项目中使用 Maven 程序集插件
我是 Maven 新手，花了大约 3 天的时间使用程序集插件生成 zip 文件，引用 http://www.petrikainulainen.net/programming/tips-and-tric
maven - 如果我的开源项目由 maven 管理并且依赖于不在 maven 存储库中的库怎么办？
想象一下这种情况。我有一个使用 Maven 管理的开源项目，它依赖于一个不在 Maven 存储库中的知名库(例如 jpathwatch)。我怎样才能让它发挥作用？直接的方法是将 jpathwatch
maven - Maven 插件和依赖项有什么区别？
我将 Neo4j 和 MongoDB 与 Grails 一起使用，我想知道 Maven Neo4j 插件是否也为我的构建提供了 Neo4j 依赖项。 MongoDB 也是如此。我很困惑。我应该使用什
maven - Nexus 在复杂的 Maven 项目上暂存 Maven 插件？
我正在尝试同时发布多个 Maven 项目，将它们部署到 oss.sonatype.org，然后将它们发布到 Maven Central。我有一个构建 pom，用于一起构建多个多模块项目。构建 pom
maven - maven 编译器 :compile works, maven 编译不
我有一个带有 maven pom.xml 的项目 4.0.0 Minimal-J Minimal-J 0.1-SNAPSHOT Minimal-J
maven - 以编程方式使用 Maven
我需要制作一个下载maven项目并打印其依赖项的小程序像这样: MavenArtifactRepository repository = new MavenArtifactRepository("t
maven - maven 如何决定何时使用目标文件夹作为类路径
我有一个关于 maven 在构建过程中如何计算类路径的问题。具体来说，控制何时使用“目标/类”以及何时使用来自存储库(本地/远程)的“jar”。我有一个版本为 1.0.0-SNAPSHOT 的项目，
maven - maven 中的属性自动大写
我有一个 maven 项目，需要在命令行(-Dmy.property=val)设置一个属性。我需要做的是将该字符串转换为所有大写，因为该属性是用于通过 maven-resources-plugin
maven - Maven Exec插件中的引用和转义
引用和转义如何对传递给 Maven 插件的参数起作用？例如，我想将多个文件名作为参数传递给 Maven Exec 插件运行的应用程序: mvnDebug exec:java -Dexec.mainC
maven - Maven 执法者是否忽略依赖管理部分？
我在父 pom 的导入的 dependencyManagement 部分中指定了一个库版本。我确认我的有效 pom 只有一次出现这种依赖。它在依赖管理部分: org.jav

首页

博学

6Ren·AI

商城

maven - 通过 Shark API 查询不起作用