apache-spark - Zeppelin无法读取本地文件系统的文件路径-6ren

apache-spark - Zeppelin无法读取本地文件系统的文件路径

转载作者：行者123 更新时间：2023-12-02 20:03:54

25

4

我已经在Windows系统上用Docker安装了Zeppelin，现在我正在尝试使用本地文件运行Zeppelin Tutorial中定义的代码，但是它抛出错误-

java.net.URISyntaxException: Expected scheme-specific part at index 2: C:
at java.net.URI$Parser.fail(URI.java:2848)
at java.net.URI$Parser.failExpecting(URI.java:2854)
at java.net.URI$Parser.parse(URI.java:3057)
at java.net.URI.<init>(URI.java:746)
at org.apache.hadoop.fs.Path.initialize(Path.java:203)
at org.apache.hadoop.fs.Path.<init>(Path.java:172)
at org.apache.hadoop.fs.Path.<init>(Path.java:94)
at org.apache.hadoop.fs.Globber.glob(Globber.java:201)
at org.apache.hadoop.fs.FileSystem.globStatus(FileSystem.java:1643)
at org.apache.hadoop.mapred.FileInputFormat.listStatus(FileInputFormat.java:222)
at org.apache.hadoop.mapred.FileInputFormat.getSplits(FileInputFormat.java:270)
at org.apache.spark.rdd.HadoopRDD.getPartitions(HadoopRDD.scala:194)
at org.apache.spark.rdd.RDD$$anonfun$partitions$2.apply(RDD.scala:252)
at org.apache.spark.rdd.RDD$$anonfun$partitions$2.apply(RDD.scala:250)
at scala.Option.getOrElse(Option.scala:121)
at org.apache.spark.rdd.RDD.partitions(RDD.scala:250)

这是我正在使用的路径-

file:///C:/xampp/htdocs/bank/bank-full.csv

码-

val bankText = sc.textFile("file:///C:/xampp/htdocs/bank/bank-full.csv")

case class Bank(age:Integer, job:String, marital : String, education : String, balance : Integer)

val bank = bankText.map(s=>s.split(";")).filter(s=>s(0)!="\"age\"").map(
s=>Bank(s(0).toInt, 
        s(1).replaceAll("\"", ""),
        s(2).replaceAll("\"", ""),
        s(3).replaceAll("\"", ""),
        s(5).replaceAll("\"", "").toInt
    )
 )

 bank.toDF().registerTempTable("bank")
 %sql select * from bank

请帮帮我。

提前致谢!

最佳答案

使用file:///xampp/htdocs/bank/bank-full.csv
并确保您的程序也位于C驱动程序中。

关于apache-spark - Zeppelin无法读取本地文件系统的文件路径，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/51476318/

25

4

0

文章推荐： docker - 通过Docker容器通过HTTPS访问localhost Web应用

文章推荐： docker - Docker:将文件夹复制到多个图像

apache-zeppelin - Apache Zeppelin - zeppelin.cmd 没有显示结果
我在 Windows 10 上的 0.81 Apache Zeppelin 上解压了完整版本。我导航到 C:\Zeppelin\bin 并输入 zeppelin.cmd 在 C:\Zeppelin\b
apache-zeppelin - 在 Apache Livy Interpreter for Zeppelin 中访问 zeppelin 上下文的问题
是否可以在 Livy Interpreter for Zeppelin 中访问 zeppelin context (z)？如果是，那么如何访问它。如果不是，这是否意味着 Livy 中的 zeppeli
apache-zeppelin - Zeppelin 可以自定义皮肤吗？
Zeppelin 可以自定义皮肤吗？换句话说，将 Zeppelin 的标志换成别的东西？最佳答案正如 bzz 的回答中已经提到的:可以自定义 zeppelin 的 UI。以下是更多细节: 查看 z
apache-zeppelin - Zeppelin 没有口译员
我刚刚在我的 Mac (Yosemite 10.10.3) 上安装了以下内容: oracle java 1.8 更新 45 斯卡拉 2.11.6 spark 1.4(预编译版本:http://d3kb
apache-zeppelin - Apache zeppelin 进程死了
我正在尝试在带有 Hadoop 1.0.3 和 Spark 1.4.0 的 Ubuntu14 上运行 zeppelin。我已经完成了源代码的构建，并且所有的包都成功地完成了构建。但是当我运行守护进程
apache-zeppelin - 如何在 Zeppelin 笔记本中的段落之间互连或添加相关性
我有一个 Zeppelin 笔记本“测试”。这个笔记本有 2 个段落，如下所示 1. %spark import statements; val df=sqlContext.read.format..
apache-zeppelin - 在 Zeppelin 中禁用目录列表
是否有人禁用了中的目录列表？齐柏林飞艇 0.6.0 (或其他版本)作为安全措施的一部分？你能不能让我知道同样的事情。最佳答案在“How to disable directory listing
apache-zeppelin - Apache Zeppelin - 设置默认解释器
在 Zeppelin 中，在每一行我都必须在每一行提供解释器。有没有办法为整个 session 设置解释器。 %pyspark import re 用了 0 秒。 import pandas as p
apache-zeppelin - Apache Zeppelin - 日期选择器
我已将 Zeppelin 连接到 MySQL 数据库。我可以检索数据，但是有问题。如何在 Zeppelin 中创建允许用户通过选择日期范围来检索数据的 SQL？最佳答案 Zeppelin 没有“
apache-zeppelin - 在 windows 上安装 zeppelin
我已经安装了 spark，我正在尝试运行 zeppelin，但就是没有运行。 Error while running Zepplin 我将其用作 JAVA_HOME，如“C:\Program File
apache-zeppelin - 如何从命令行运行 zeppelin notebook(自动)
我们如何从命令行运行笔记本？除了 1，我如何将命令行参数传递到笔记本中？ IE。从笔记本代码中访问命令行参数？最佳答案所以我遇到了同样的问题，并设法弄清楚如何使用 API 来使用 curl 运行
apache-zeppelin - 在 Zeppelin jdbc 解释器中使用日期选择器
我的 Zeppelin 笔记本中有一组图表，它们使用 jdbc interperter 从数据库中获取一段时间的数据。我想做的是能够选择一个适用于所有图表的时期。我可以看到可以使用 Dynamic
apache-zeppelin - Zeppelin 笔记可以和 git 集成吗？
是否可以将 Zeppelin 笔记与 git 集成？人们可以设置存储库位置，但如何将其设置为远程 git 存储库。不过，此功能可在 Amazon EMR 上使用最佳答案是的。这是可能的我使用以
apache-spark - Zeppeline - 如何设置 Zeppeline 以连接到远程 sparkmaster？
我在一组单独的主机上有 5 个节点的 spark 集群。我在单独的主机上安装了 zeppeline，并连接了 spark 解释器以针对 spark 集群执行查询。 Zeppeline 版本 1.6 -
apache-zeppelin - 使用 zeppelin 在 csv 中导出数据
我需要从 zeppelin 中的 %sql 解释器以 csv 格式导出数据。我怎么能这样做？我需要添加一个按钮，然后单击它应该将数据导出到 csv 中，如客户端 sql 解释器中 zeppelin
apache-zeppelin - Apache Zeppelin 安装 grunt 构建错误
我的配置如下: Ubuntu 15.04 Java 1.7 Spark 1.4.1 Hadoop 2.7 Maven 3.3.3 我正在尝试从 github 成功克隆并使用以下命令安装 Apache
apache-zeppelin - z.load in apache zeppelin 导致错误
我正在 apache zeppelin 中尝试 z.load 如下: %dep z.load("/zeppelin-0.5.6-incubating-bin-all/lplibs/hive/csv-s
apache-zeppelin - 如何在 Zeppelin 中使用 Angular Controller
我是 Zeppelin 的新手，最近我正在研究如何在我当前的项目中使用 Zeppelin。我想在 Zeppelin 段落中添加一个 Angular Controller 。但它失败了。你能给我一些解决
hadoop - ZEPPELIN:无法找到或加载主类org.apache.zeppelin.server.ZeppelinServer
我有 OS Red Hat Enterprise Linux Server release 7.4 (Maipo) Ambari Version 2.5.1.0 HDP 2.6 尝试启动Zeppeli
apache-zeppelin - Zeppelin - 将变量从 Spark 传递到 Markdown 以生成动态叙述文本
是否可以将变量从 Spark 解释器(pyspark 或 sql)传递给 Markdown？要求是显示格式良好的文本(即 Markdown)，例如“20 个事件发生在 2017-01-01 和 201

首页

博学

6Ren·AI

商城

apache-spark - Zeppelin无法读取本地文件系统的文件路径