- android - RelativeLayout 背景可绘制重叠内容
- android - 如何链接 cpufeatures lib 以获取 native android 库?
- java - OnItemClickListener 不起作用,但 OnLongItemClickListener 在自定义 ListView 中起作用
- java - Android 文件转字符串
所以我对 Hadoop 和命令行是全新的,尽管我以前做过一些编程(作为学生)。我正在尝试在学校机器上从 Putty 运行一些简单的程序(教程的一部分)。
我之前已经让 Hadoop 命令工作,并且运行一个不同的简单程序也很好,但我坚持使用这个。不,这不是家庭作业。只是了解 Hadoop 命令的教程。
说明如下:
/*
测试代码
我们执行符合典型 UNIX 风格管道的本地测试,我们的测试将采用以下形式:
猫 | map |排序 |减少它模拟 Hadoop 在流式传输时将执行的相同管道,尽管是以非分布式方式进行的。您必须确保文件 mapper.py 和 reducer.py 具有执行权限:
chmod u+x mapper.pychmod u+x reducer.py
尝试以下命令并解释结果(提示:在终端窗口中键入 man sort 以了解有关 sort 命令的更多信息):
echo "这是一个测试,应该计算单词的数量"| ./映射器.py |排序-k1,1 | ./reducer.py
*/
运行“hdfs dfs -ls/user/$USER 给出以下结果:
找到 6 个项目drwxr-xr-x-s1353460 s1353460 0 2015-10-20 10:51/user/s1353460/QuasiMonteCarlo_1445334654365_163883167drwxr-xr-x-s1353460 s1353460 0 2015-10-20 10:51/用户/s1353460/数据-rw-r--r-- 3 s1353460 s1353460 360 2015-10-20 12:13/user/s1353460/mapper.py-rw-r--r-- 3 s1353460 s1353460 15346 2015-10-20 11:11/user/s1353460/part-r-00000-rw-r--r-- 2 s1353460 s1353460 728 2015-10-21 10:21/user/s1353460/reducer.pydrwxr-xr-x-s1353460 s1353460 0 2015-10-16 14:38/user/s1353460/source
但是运行 "echo "this is a test and this should count the number of words"|/user/$USER/mapper.py | sort -k1,1 |/user/$USER/reducer.py"返回错误:
-bash:/user/s1353460/reducer.py: 没有那个文件或目录-bash:/user/s1353460/mapper.py: 没有那个文件或目录
这看起来很奇怪,因为恰好在上面列出了那个位置。知道这里会发生什么吗?
最佳答案
But running "echo "this is a test and this should count the number of words" | /user/$USER/mapper.py | sort -k1,1 | /user/$USER/reducer.py" returns errors:
-bash: /user/s1353460/reducer.py: No such file or directory -bash: /user/s1353460/mapper.py: No such file or directory
您已经在 HDFS 上创建了 mapper.py
和 reducer.py
.当您运行此命令时,它会在您的本地文件系统上搜索 mapper.py
和 reducer.py
,而不是在HDFS
。
解决这个问题:
确保/user/s1353460/存在于您的本地文件系统
。如果没有,创建相同的,然后复制或创建 mapper.py
& reducer.py
在/用户/s1353460/
确保mapper.py
有执行权限chmod +x/user/s1353460/mapper.py
确保 reducer.py
有执行权限 chmod +x/user/s1353460/reducer.py
运行echo "this is a test and this should count the number of words"|/用户/s1353460/mapper.py |排序-k1,1 |/user/s1353460/reducer.py
这次应该可以正常工作,没有任何错误。
在 Hadoop 集群上运行 Python MapReduce 作业:
hduser@ubuntu:/usr/local/hadoop$ bin/hadoop jar contrib/streaming/hadoop-*streaming*.jar \
-file /user/s1353460/mapper.py -mapper /user/s1353460/mapper.py \
-file /user/s1353460/reducer.py -reducer /user/s1353460/reducer.py \
-input <hdfs-input-path> -output <hdfs-output-path>
假设 Hadoop
安装在/usr/local/hadoop
.适当更改路径。
关于Hadoop:没有这样的文件或目录,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33273247/
我正在为我的程序编写安装脚本,它应该在 Linux/Unix 操作系统上运行。以下文件的默认目录是什么: 可执行文件(程序)。程序应通过从命令行键入其名称来执行。 共享库。 第三方共享库(程序未开源,
我有一堆用户、组和应用程序注册,我的 MVC 应用程序使用 AAD 数据进行身份验证和授权。是否可以将 Azure Active Directory 从一个租户(目录)迁移到另一个租户(目录)?如果可
查看 cljsbuild 文档 https://github.com/emezeske/lein-cljsbuild :cljsbuild { :builds [{ ; The
忽略已经版本控制的文件 如果你不小心添加了一些应该被忽略的文件,你如何将它们从版本控制中去除而不会丢失它们?或许你有自己的IDE配置文件,不是项目的一部分,但将会花费很多时间使之按照自己的方式工作。
我想使用\tableofcontents 命令,但没有目录从新页面开始或在末尾创建新页面,并且所有内容都是单倍行距。我怎样才能做到这一点?我假设使用 tocloft,但有哪些选择? 谢谢 最佳答案 试
我有一些 javascript 菜单代码,可以在单独的目录中正常工作。但是,当我尝试从同一目录中调用相同的 .js 文件时,它不会看到这些文件。 以下内容来自另一个目录: script type="t
我有这样的路径: /my/path/to/important_folder 在同一级别上,我还有其他文件和文件夹想要在达到与 important_folder 相同的级别时列出。 我的文件夹可能更深,
1、获取文件路径实现 1.1 获取当前文件路径 ? 1
我正在使用最新版本的 NTEmacs。 我写了一个名为“.dir-locals.el”的文件,如下所示。 ((nil . ((tab-width . 8) (fill-column .
关闭。这个问题不满足Stack Overflow guidelines .它目前不接受答案。 想改善这个问题吗?更新问题,使其成为 on-topic对于堆栈溢出。 7年前关闭。 Improve thi
在我的 .vimrc 中有这些行 :set foldmethod=marker :set foldmarker=SECTION:,ENDSECTION: 用于自定义代码折叠。在我的文件中,相关语言的注
在 fish 中: for x in * echo $x end *这里包括所有目录和文件,如何只列出文件(或目录)? 最佳答案 fish 没有很多花哨的通配语法。但是,目录可以像这样迭代: f
这是我的目录结构: ├── src │ ├── helpers │ │ ├── __init__.py │ │ ├── foo.py │ │ └── bar.py │
我想递归重命名文件夹/目录名称并找到 this solution所以。但是这个命令没有效果 find . -type f -exec rename 's/old/new/' '{}' \; 这是一个正
我想在相册中创建一个文件夹,并希望将图像保存在创建的相册中。 这可能吗?有什么办法可以做到这一点吗? 我已经搜索过,大多数人都说这是不可能的。 感谢您的帮助。 最佳答案 您也许可以使用AssetsLi
如何在python中使用用户定义的名称创建临时文件/目录。我知道 tempfile .但是我看不到任何以文件名作为参数的函数。 注意:我需要这个来对包含临时文件的临时目录上的 glob(文件名模式匹配
我在项目中使用JaCoCo Gradle插件。 作为问题的一个示例,我的大部分代码都在com.me.mysoftware包下。 我正在使用代码生成器来生成build/generated/java/..
我正在尝试使用 Gradle 开始运行 jar 文件 我的任务如下所示: task startServer(type: Exec) { workingDir file("${buildDir}/a
如何在 Ant 中定义一个目录集,其中包括两个目录:项目的基目录和子目录“test”? 看起来您无法使用“/”、“.”或“”专门包含目录集的根目录。例如,这包括“./test”,但不包括“.”:
我正在使用 CTAGs 包,它使用 Sublime Text 2 生成两个文件 .tags 和 .tags_sorted_by_file。 那么当我进行项目搜索(CMD + SHIFT + F)时,如
我是一名优秀的程序员,十分优秀!