- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我遵循一个教程来学习Java Hadoop。我在Wordcount
中编写了IntelliJ
程序,该作业成功完成,并且可以看到正确的输出文件。现在,我想在Hadoop集群中运行该应用程序,但失败了。 Hadoop设置本身就可以正常启动。这是我在目录中的内容,
$ hadoop fs -ls
2018-08-18 09:15:44,012 WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable
Found 2 items
drwxr-xr-x - chaklader supergroup 0 2018-08-17 12:17 Wordcount
-rw-r--r-- 1 chaklader supergroup 530989 2018-08-15 13:13 forum_users.tsv
pom.xml
文件,
<project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
<modelVersion>4.0.0</modelVersion>
<groupId>com.test</groupId>
<artifactId>wordcount</artifactId>
<version>0.0.1-SNAPSHOT</version>
<packaging>jar</packaging>
<name>wordcount</name>
<url>http://maven.apache.org</url>
<properties>
<project.build.sourceEncoding>UTF-8</project.build.sourceEncoding>
</properties>
<dependencies>
<!-- Hadoop -->
<dependency>
<groupId>org.apache.hadoop</groupId>
<artifactId>hadoop-core</artifactId>
<version>RELEASE</version>
</dependency>
<dependency>
<groupId>junit</groupId>
<artifactId>junit</artifactId>
<version>RELEASE</version>
<scope>test</scope>
</dependency>
</dependencies>
<build>
<plugins>
<plugin>
<groupId>org.codehaus.mojo</groupId>
<artifactId>exec-maven-plugin</artifactId>
<version>1.2.1</version>
<executions>
<execution>
<goals>
<goal>java</goal>
</goals>
</execution>
</executions>
<configuration>
<mainClass>com.test.hadoop.WordCount</mainClass>
</configuration>
</plugin>
</plugins>
</build>
</project>
JAR
文件,即
wordcount.jar
,并将其放入
Downloads
目录中。最后,我执行命令以在
Hadoop
集群中运行作业,
$ hadoop jar Downloads/wordcount.jar /Users/chaklader/IdeaProjects/Wordcount/src/main/java/com/test/hadoop/WordCount /user/chaklader/Wordcount/Input/input.txt /user/chaklader/Wordcount/Output
Usage: WordCount needs two arguments <input> <output> files
WordCount needs two arguments <input> <output> files
。我检查了所有路径,似乎是正确的。
最佳答案
您应该提供WordCount类的包路径。
改变这个
$ hadoop jar Downloads/wordcount.jar /Users/chaklader/IdeaProjects/Wordcount/src/main/java/com/test/hadoop/WordCount /user/chaklader/Wordcount/Input/input.txt /user/chaklader/Wordcount/Output
$ hadoop jar Downloads/wordcount.jar com.test.hadoop.WordCount /user/chaklader/Wordcount/Input/input.txt /user/chaklader/Wordcount/Output
关于java - 在Hadoop群集上执行字数统计,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51904964/
嗨,我是excel的初学者,所以请原谅我的无知。 最近我发现自己需要一个函数来计算一系列单元格中的单词数(当然,将空单元格计为 0)。 在网上冲浪我发现了这个简单的 VBA 代码: Function
我是编程新手,这段代码不想工作,而且我已经没有想法了。它可以很好地读取文件,但不会计算任何内容。我知道它与 while 语句有关。这是针对两个单独的文件,但它们都需要显示在末尾。 #define _C
我用 Java 实现了一个字数统计程序。基本上,该程序需要一个大文件(在我的测试中,我使用了一个仅包含数字的 10 GB 数据文件),并计算每个“单词”出现的次数 - 在这种情况下,一个数字(例如 2
长话短说:1986 年,一位面试官要求 Donald Knuth 编写一个程序,输入文本和数字 N,并列出按频率排序的 N 个最常用的词。 Knuth 编写了一个 10 页的 Pascal 程序,Do
我有一个包含 2 个字段的表: cnt str -- ------- 60 the 58 of 4 no 30 the 2 of 1 no 我想要这样的结果 cnt
各位seoer应该都明白,要想网站有排名,收录是前提条件,没有收录完全谈不上排名、流量。但是内页的收录往往是seo最大的难题之一,笔者手上有一堆网站都是只被收录了首页或者几页内页,因此解决内页收录问
是否可以设置一个 checkstyle 规则来计算评论中的字数,然后在字数低于定义的限制时显示问题。我在checkstyle上搜索了Javadoc属性,但没有发现有用的东西。 例如: /** * S
我有一个名为“input.txt”的文本文件,其中包含: test line one test line two final line 编译并运行后通过 $ ./a.exe #include
我目前在带有 pandas 0.23.4 的 Jupyter Notebook (v5.6.0) 中使用 python3.7。 我编写了代码来标记一些日语单词,并成功应用了一个字数统计函数,该函数返回
我刚刚用出色的 Redactor 替换了 CKEditor(它伴随着大量与 AJAX 更新 DOM 相关的神秘问题) .我们以前使用 CKEditor 插件为我们提供富文本编辑器的字符数。我怎样才能用
我想在 Eclipse 集群上运行 hadoop 字数统计。但我收到错误。我更改了输出目录,但程序行为没有变化。你能帮我解决这个错误吗: 2013-10-23 23:06:13,783 WA
我正在尝试运行一个 wordcount 程序,但我收到以下代码的错误 job.setInputFormatClass(TextInputFormat.class); job.setOutputForm
这是 Hadoop 字数统计 java map 和 reduce 源代码: 在 map 函数中,我已经可以输出所有以字母“c”开头的单词以及该单词出现的总次数,但我想做的只是输出以字母“c”开头的单词
我是一名优秀的程序员,十分优秀!