python - "Failed to locate the winutils binary"但我的 pyspark 仍然有效-6ren

python - "Failed to locate the winutils binary"但我的 pyspark 仍然有效

转载作者：可可西里更新时间：2023-11-01 15:43:17

35

4

在 Windows 中，当我启动 pyspark shell 时，出现错误:

2019-04-20 08:11:34 ERROR Shell:397 - Failed to locate the winutils binary in the hadoop binary path
java.io.IOException: Could not locate executable null\bin\winutils.exe in the Hadoop binaries.

但是，在那个错误之后，我的 pyspark shell 可以正常启动，并且我可以毫无问题地运行 pyspark 并在其上运行代码。但是，我每次都会收到此错误，但我不确定如何摆脱它。

我已经正确设置了我的环境变量(就像很多人针对这个问题所建议的那样)并且我在正确的 bin 文件夹中有 winutils.exe。 (我在 Hadoop 的相应 bin 文件夹中也有 winutils.exe 和 hadoop.dll)。我相信如果没有设置这些东西，pyspark shell 甚至无法工作。

作为引用，我的环境变量设置为:

HADOOP_HOME: C:\hadoop
SPARK_HOME:C:\Spark\spark-2.3.3-bin-hadoop2.7
在我放置的路径中:C:\Spark\spark-2.3.3-bin-hadoop2.7 和 C:\hadoop\bin。

我已经为系统变量(除了用户变量)放置了相同的变量。

Hadoop 也可以正常运行并启动(除了显示 50070 UI，而它显示 8080 UI，尽管这可能是一个单独的问题)。

这可能只是一个不会消失的缓存错误吗？有什么建议可以摆脱它吗？谢谢!

最佳答案

我解决了这个问题!错误不再显示。我只是对这些文件进行了以下更改:“conf\spark-env.sh > set HADOOP_HOME=C:\hadoop; in conf\spark-defaults.conf > spark.driver.extraJavaOptions -Djava.library.path=C:/hadoop/bin"

正如该用户在评论中所建议的那样:

Could not locate executable C:\hadoop\bin\winutils.exe in the hadoop binaries

因此，除了在/bin 中拥有适当的 winutils.exe 之外，您的环境变量也按照我上面写的那样设置，还必须将这些添加到我上面指定的文件中。那么在windows上本地运行pyspark应该就没有问题和错误了!

关于python - "Failed to locate the winutils binary"但我的 pyspark 仍然有效，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/55775994/

35

4

0

文章推荐： hadoop - 如何将 presto 集群集成到 hadoop 集群？

文章推荐： hadoop - 重新部署后 HBase 协处理器未更新

文章推荐： hadoop - 以 MB 或 Mb 为单位的 mapreduce 指标中的吞吐量

文章推荐： java - 为什么 reducer 在我的情况下不能正常工作？

python - winutils.exe 已停止工作
我在 python 中使用了 pySpark，并设置环境变量 HADOOP_HOME 以指向 EC2 中 Windows Server 2012 上的 bin\winutils.exe 之上的文件夹。
windows - windows上Hadoop+HBase集群 : winutils not found
我正在尝试在 Windows 上使用 Hadoop 2.20 和 HBase 0.98 设置一个完全分布式的 4 节点开发集群。我在 Windows 上成功构建了 Hadoop，最近还在 Window
windows - winutils.exe chmod 命令未设置权限
> D:\>echo %HADOOP_HOME% > D:\Apps\winutils\hadoop-2.7.1 在与 HADOOP_HOME 相同的磁盘上创建 tmp/hive 文件夹 D:\>d
apache-spark - hadoop.dll，winutils.exe和在hadoop上构建的多个应用程序
在Windows 10操作系统上下载Spark并正确设置所有环境和系统变量时，我收到一条代码执行错误，指出“null / bin / winutils.exe不存在”。我通过下载winutils.ex
hadoop - 无法在 hadoop 二进制路径中找到 winutils 二进制文件
为最新的 hadoop-2.2 版本启动名称节点时，我收到以下错误。我没有在 hadoop bin 文件夹中找到 winutils exe 文件。我尝试了以下命令 $ bin/hdfs namenod
windows - winutils spark windows 安装 env_variable
我正在尝试在 Windows 10 上安装 Spark 1.6.1，到目前为止我已经完成了以下操作...... 下载spark 1.6.1，解压到某个目录，然后设置SPARK_HOME 下载scala
python - Pyspark - 无法在 hadoop 二进制路径中找到 winutils 二进制文件
这个问题在这里已经有了答案: Failed to locate the winutils binary in the hadoop binary path (17 个回答) 3年前关闭。我正在尝试将
hadoop - Windows 上的 Spark - winutils 到底是什么，我们为什么需要它？
我很好奇!据我所知，HDFS 需要数据节点进程才能运行，这就是它只在服务器上运行的原因。 Spark 可以在本地运行，但需要 winutils.exe，它是 Hadoop 的一个组件。但它到底做了什么
hadoop - Windows 上的 Spark - winutils 到底是什么，我们为什么需要它？
我很好奇!据我所知，HDFS 需要数据节点进程才能运行，这就是它只在服务器上运行的原因。 Spark 可以在本地运行，但需要 winutils.exe，它是 Hadoop 的一个组件。但它到底做了什么
java - 如何设置 winutils.exe 的确切路径以使用 Java 访问 HDFS？
在我的系统变量中，HADOOP_HOME 设置为 C:\hadoop-2.7.2\bin 我尝试使用以下代码访问 HDFS: FileSystem hdfs = FileSystem.get(new
python - "Failed to locate the winutils binary"但我的 pyspark 仍然有效
在 Windows 中，当我启动 pyspark shell 时，出现错误: 2019-04-20 08:11:34 ERROR Shell:397 - Failed to locate the wi
hadoop - 如何消除错误 util.Shell : Failed to locate the winutils binary
我在 eclipse 下从 Windows 机器(客户端)执行远程作业，我澄清我的 Windows 客户端上没有安装任何 hadoop，我不需要，我正在远程执行 hadoop 作业，hadoop 是安
org.weasis.core.api.gui.util.WinUtil.getParentOfClass()方法的使用及代码示例
本文整理了Java中org.weasis.core.api.gui.util.WinUtil.getParentOfClass()方法的一些代码示例，展示了WinUtil.getParentOfCla
org.weasis.core.api.gui.util.WinUtil.getParentWindow()方法的使用及代码示例
本文整理了Java中org.weasis.core.api.gui.util.WinUtil.getParentWindow()方法的一些代码示例，展示了WinUtil.getParentWindow
org.weasis.core.api.gui.util.WinUtil.getParentDialog()方法的使用及代码示例
本文整理了Java中org.weasis.core.api.gui.util.WinUtil.getParentDialog()方法的一些代码示例，展示了WinUtil.getParentDialog
delphi - 如何将 EXPLICIT_ACCESS 与 SetEntriesInAcl 的 jedi-winutils 正确对齐？
我尝试使用 SetEntriesInAclA 从 Free Pascal 中的 EXPLICIT_ACCESS_A 数组创建新的 ACL，但我不断收到来自的错误代码 87(无效参数) >SetEnt
java - 我在 Hadoop 中收到此错误，无法找到可执行文件 null\bin\winutils.exe
我是 Hadoop 系统的新手，在尝试获取 Hadoop (HDFS) 的文件系统时遇到以下错误设置是在 Ubuntu Server 15.05 上运行的 Hadoop。和一个在 Windows 上运
apache-spark - 无法在 hadoop 二进制文件中找到可执行文件 null\bin\winutils.exe
最近我在我的系统中安装了 canopy 和 spark。当我在 canopy 命令提示符下的 c:\spark 路径中运行 pyspark 命令时，出现此错误，但该路径中存在 winutils。我是新
尝试连接到 HDFS 的 Java 抛出 HADOOP_HOME 未设置，找不到 winutils
我正在尝试制作一个应用程序原型(prototype)，以将 Hadoop 用作数据存储，但我在第一个障碍上摔倒了。我可以访问 Hadoop 集群，并且从 Spring 中窃取了一个测试样本来尝试第一步
java - Spark 1.6-无法在 hadoop 二进制路径中找到 winutils 二进制文件
我知道有一个与此非常相似的帖子(Failed to locate the winutils binary in the hadoop binary path)，但是，我已经尝试了建议的每个步骤，但仍然

首页

博学

6Ren·AI

商城

python - "Failed to locate the winutils binary"但我的 pyspark 仍然有效