gpt4 book ai didi

windows - Spark 文件系统观察程序无法在 Windows 上运行

转载 作者:行者123 更新时间:2023-12-04 18:46:15 25 4
gpt4 key购买 nike

两人测试Apache Spark在他们的电脑上...

Spark Download

我们下载了适用于 Hadoop 2.6 的 Spark prebuild 版本,转到文件夹 /spark-1.6.2-bin-hadoop2.6/ ,创建了一个“tmp”目录,然后运行:

$ bin/run-example org.apache.spark.examples.streaming.HdfsWordCount tmp

我添加了任意文件 content1content2dssdgdg到那个“tmp”目录。
-------------------------------------------
Time: 1467921704000 ms
-------------------------------------------
(content1,1)
(content2dssdgdg,1)

-------------------------------------------
Time: 1467921706000 ms

Spark 在我的 Ubuntu 15.10 笔记本电脑上检测到具有上述终端输出的这些文件,但在我同事的 Windows 7 Enterprise 笔记本电脑上却没有。

Spark 的文件系统观察程序不能在 Windows 上运行吗?

最佳答案

约翰,我建议对托管在 https://github.com/karthikj1/Hadoop-2.7.1-Windows-64-binaries 的 64 位 Windows 7 使用 hadoop 编译的二进制文件。 .要使用这个 hadoop 版本,您需要使用为用户提供的 hadoop 预先构建的 spark 版本。确保按照 https://spark.apache.org/docs/latest/hadoop-provided.html 中所述设置 SPARK_DIST_CLASSPATH .还将 %HADOOP_HOME%\lib\native 放在 PATH 上。设置完成后,您需要按照 https://wiki.apache.org/hadoop/Hadoop2OnWindows 中提到的步骤 3.1、3.3、3.4 和 3.5 进行操作。启动本地 HDFS。在运行 HdfsWordCount 时,您需要将 hdfs:///tmp 作为目录路径参数传递。一切顺利。

关于windows - Spark 文件系统观察程序无法在 Windows 上运行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38254405/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com