maven - 由 : java. lang.ClassNotFoundException : org. apache.hadoop.fs.CanSetDropBehind issue in eclipse 引起-6ren

maven - 由 : java. lang.ClassNotFoundException : org. apache.hadoop.fs.CanSetDropBehind issue in eclipse 引起

转载作者：可可西里更新时间：2023-11-01 16:31:14

25

4

我有以下 spark 字数统计程序:

    package com.sample.spark;
    import java.util.Arrays;
    import java.util.List;
    import java.util.Map;
    import org.apache.spark.SparkConf;
    import org.apache.spark.api.java.*;
    import org.apache.spark.api.java.function.FlatMapFunction;
    import org.apache.spark.api.java.function.Function;
    import org.apache.spark.api.java.function.Function2;
    import org.apache.spark.api.java.function.PairFlatMapFunction;
    import org.apache.spark.api.java.function.PairFunction;
    import org.apache.hadoop.fs.FSDataInputStream;
    import org.apache.hadoop.fs.FSDataOutputStream;
    import scala.Tuple2;


    public class SparkWordCount {

        public static void main(String[] args) {
            SparkConf conf = new SparkConf().setAppName("wordcountspark").setMaster("local").setSparkHome("/Users/hadoop/spark-1.4.0-bin-hadoop1");
            JavaSparkContext sc = new JavaSparkContext(conf);
            //SparkConf conf = new SparkConf();
            //JavaSparkContext sc = new JavaSparkContext("hdfs", "Simple App","/Users/hadoop/spark-1.4.0-bin-hadoop1", new String[]{"target/simple-project-1.0.jar"});
            JavaRDD<String> textFile = sc.textFile("hdfs://localhost:54310/data/wordcount");
            JavaRDD<String> words = textFile.flatMap(new FlatMapFunction<String, String>() {
              public Iterable<String> call(String s) { return Arrays.asList(s.split(" ")); }
            });
            JavaPairRDD<String, Integer> pairs = words.mapToPair(new PairFunction<String, String, Integer>() {
                public Tuple2<String, Integer> call(String s) { return new Tuple2<String, Integer>(s, 1); }

            });

            JavaPairRDD<String, Integer> counts = pairs.reduceByKey(new Function2<Integer, Integer, Integer>() {
                  public Integer call(Integer a, Integer b) { return a + b; }
                });  
            counts.saveAsTextFile("hdfs://localhost:54310/data/output/spark/outfile");

        }


    }

当我从 eclipse 运行代码时，出现 Caused by: java.lang.ClassNotFoundException: org.apache.hadoop.fs.CanSetDropBehind 异常，但是如果我导出为可运行的 jar 并从终端运行，如下所示:

      bin/spark-submit --class com.sample.spark.SparkWordCount --master local  /Users/hadoop/spark-1.4.0-bin-hadoop1/finalJars/SparkJar-v2.jar

maven pom 看起来像:

    <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
        xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/maven-v4_0_0.xsd">
        <modelVersion>4.0.0</modelVersion>
        <groupId>com.sample.spark</groupId>
        <artifactId>SparkRags</artifactId>
        <packaging>jar</packaging>
        <version>1.0-SNAPSHOT</version>
        <name>SparkRags</name>
        <url>http://maven.apache.org</url>
        <dependencies>
            <dependency>
                <groupId>junit</groupId>
                <artifactId>junit</artifactId>
                <version>3.8.1</version>
                <scope>test</scope>
            </dependency>
            <dependency> <!-- Spark dependency -->
                <groupId>org.apache.spark</groupId>
                <artifactId>spark-core_2.10</artifactId>
                <version>1.4.0</version>
                <scope>compile</scope>
            </dependency>
            <dependency>
                <groupId>org.apache.hadoop</groupId>
                <artifactId>hadoop-common</artifactId>
                <version>0.23.11</version>
                <scope>compile</scope>
            </dependency>
            <dependency>
                <groupId>org.apache.hadoop</groupId>
                <artifactId>hadoop-core</artifactId>
                <version>1.2.1</version>
                <scope>compile</scope>
            </dependency>
    </dependencies>
    </project>

最佳答案

当您在 eclipse 中运行时，引用的 jar 是您的程序运行的唯一来源。因此，由于某些原因，jar hadoop-core(即 CanSetDropBehind 所在的位置)未从本地存储库正确添加到您的 eclipse 中。如果是代理问题或任何其他 pom.xml 问题，您需要确定这一点。

当您从终端运行 jar 时，运行的原因可能是由于引用的类路径中存在 jar。此外，在从终端运行时，您还可以选择将这些 jar 作为 fat jar(包括 hadoop-core)放在您的 jar 中。我希望你在创建 jar 时没有使用这个选项。然后将从您的 jar 中选择引用，而不依赖于类路径。

验证每个步骤，这将帮助您找出原因。快乐编码

关于maven - 由 : java. lang.ClassNotFoundException : org. apache.hadoop.fs.CanSetDropBehind issue in eclipse 引起，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/30956799/

25

4

0

文章推荐： Java 摘要认证 POST XML

文章推荐： java - 如何漂亮地打印 HttpServletRequest 和 HttpServletResponse

文章推荐： Hadoop "hadoop dfsadmin -safemode leave"命令已弃用

Should I import 'fs' or 'node:fs' in Bun?(我应该在Bun中导入‘fs’还是‘node：FS’？)
我正在尝试将我的Node.js项目迁移到Bun。我的项目在很多地方使用了‘fs’包。我发现了许多Bun迁移示例，它们将‘fs’包导入为‘node：FS’。但是，作为“文件系统”导入可以很好地工作，没有
Should I import 'fs' or 'node:fs' in Bun?(我应该在Bun中导入‘fs’还是‘node：FS’？)
我正在尝试将我的Node.js项目迁移到Bun。我的项目在很多地方使用了‘fs’包。我发现了许多Bun迁移示例，它们将‘fs’包导入为‘node：FS’。但是，作为“文件系统”导入可以很好地工作，没有
node.js - 模块初始化错误 : Error at Object. fs.openSync (fs.js :646:18) at Object. fs.readFileSync (fs.js:551:33)
我正在使用 aws lambda。我有一个 .p8 文件，用于发送 apns 通知。因为我不能使用相对或绝对路径，因为它没有服务器。我必须从 s3 url 读取它。为此我做了这个 let file
file - hadoop fs -text vs hadoop fs -cat vs hadoop fs -get
我相信以下所有命令都可用于将 hdfs 文件复制到本地文件系统。有什么区别/情境利弊。 (这里是 Hadoop 新手)。 hadoop fs -text /hdfs_dir/* >> /local_d
node.js - 当我们已经有了 fs.read 和 fs.write 时，为什么还要使用 fs.open 呢？
这是一个新手问题，但我有点困惑为什么需要 open 与 r 、 w 、 a 以及这些标志的所有变体。如果他/她想读取或写入文件而不是使用 open，难道不应该简单地使用 readFile 或 writ
javascript - 使用 import fs from 'fs'
我想在 JavaScript 中使用 import fs from 'fs'。这是一个示例: import fs from 'fs' var output = fs.readFileSync('som
svn - 人为增加 SVN (FS FS) 存储库中的修订号
我的公司正在执行 SVN 存储库迁移，我想避免两个存储库(目前都处于事件状态)之间的修订号重叠。我的要求是将新存储库的修订强制为特定的修订号(例如:100.000)。通过分析 FSFS 存储库，我
hadoop - hadoop fs -put和hadoop fs -copyFromLocal之间的区别
-put和-copyFromLocal被记录为相同，而大多数示例使用详细的变体-copyFromLocal。为什么？ -get和-copyToLocal相同最佳答案 copyFromLocal与pu
javascript - fs.writeFileSnyc/fs.writeFile 写入损坏的文件
我正在调用 Google 云端硬盘的下载 API，然后我想使用 fs.writeFile 或 fs.writeFileSync 在本地写入下载的文件。这就是我正在做的事情: const wri
Node.js fs.readdir、fs.stat
我正在学习一些教程，但无法理解为什么这一行“self.only_dirs.push(files[i]);”导致有关它“未定义”的错误。这肯定是一个变量范围问题，但我尝试过的都没有成功。我需要如何声明变
javascript - PhantomJS 问题写入文件 fs。找不到变量 : fs
我是第一次尝试 phantomJS，我已经成功地从站点中提取了 som 数据，但是当我尝试将一些内容写入文件时，我收到错误:ReferenceError:找不到变量:fs 这是我的脚本 var pag
javascript - fs.readdir 和 fs.readfile 和正则表达式
这是一个 Node 应用程序，运行 Express 服务器。我有一个包含文本文件的文件夹。我需要能够进入文件夹内的每个文件，并提取包含单词“SAVE”的行。我被困在这一步了。 app.get('/l
MongoDB 删除不在 fs.files 中的 fs.chunks
我在 fs.chunks 中有 10 GB 的数据，我想删除不在 fs.files 上的所有文档。我已经删除了我不想要的 fs.files 中的每个条目，所以 fs.files 中的每个 id 都是我
node.js - fs.exists、fs.existsSync - 为什么不推荐使用它们？
我注意到官方 Node 文档对 fs.exists 的描述令人吃惊: "fs.exists() is an anachronism and exists only for historical rea
javascript - 如何将 fs.createReadstream 与 fs.promises 一起使用
我用 require("fs").promises只是为了避免使用回调函数。但是现在，我也想用fs.createReadstream使用 POST 请求附加文件。我怎样才能做到这一点？或者在这种
node.js - fs.writeFile() 和 fs.readFile() 奇怪的行为
我正在使用 Electron 和 React 编写桌面应用程序。我想将一些信息存储在 JSON 文件中。我试过 web-fs 和 browserify-fs 来完成这个，但都没有按预期工作。我的设置如
javascript - fs.createRead/WriteStream() 与 fs.promises.open()
其中哪一个更适合在 Node 服务器应用程序的文件管理器类型中处理文件读/写操作？一个比另一个快吗？速度非常重要，因为该应用程序应该能够同时处理许多用户请求最佳答案流的独特之处在于，不是程序像传
c++ - 使用 fs::recursive_directory_iterator() 和 fs::directory_iterator() 的通用方法
我需要递归或不递归地遍历文件夹(给定 bool 参数)。我发现有 fs::recursive_directory_iterator() 和 fs::directory_iterator()。在 Jav
javascript - 如何在不全局修改 fs 的情况下执行 Promise.promisfyAll(fs)(在编写库时)？
AFAICT，如果我正在编写一个库并使用 Promise.promisifyAll(fs);，这会修改 fs 模块(而不是返回修改后的复制)。因此，如果有人导入我的库，这也会对他们修改 fs 产生副作
javascript - fs.readFile() 或 fs.readFileSync() 不是函数异常，但为什么呢？
我正在使用带有以下导入代码的 fs 模块导入 fs = require('fs') 代码一直运行，直到在下面的 TypeScript 代码的第二行遇到此异常 const filePath = 'da

首页

博学

6Ren·AI

商城

maven - 由 : java. lang.ClassNotFoundException : org. apache.hadoop.fs.CanSetDropBehind issue in eclipse 引起