azure - Spark-Shell错误: No FileSystem for scheme: wasb-6ren

azure - Spark-Shell错误: No FileSystem for scheme: wasb

转载作者：可可西里更新时间：2023-11-01 14:27:33

25

4

我们在 Azure 中运行 HDInsight 群集，但它不允许在创建群集时启动边缘/网关节点。所以我通过安装创建这个边缘/网关节点

echo 'deb http://private-repo-1.hortonworks.com/HDP/ubuntu14/2.x/updates/2.4.2.0 HDP main' >> /etc/apt/sources.list.d/HDP.list
echo 'deb http://private-repo-1.hortonworks.com/HDP-UTILS-1.1.0.20/repos/ubuntu14 HDP-UTILS main'  >> /etc/apt/sources.list.d/HDP.list
echo 'deb [arch=amd64] https://apt-mo.trafficmanager.net/repos/azurecore/ trusty main' >> /etc/apt/sources.list.d/azure-public-trusty.list
gpg --keyserver pgp.mit.edu --recv-keys B9733A7A07513CAD
gpg -a --export 07513CAD | apt-key add -
gpg --keyserver pgp.mit.edu --recv-keys B02C46DF417A0893
gpg -a --export 417A0893 | apt-key add -
apt-get -y install openjdk-7-jdk
export JAVA_HOME=/usr/lib/jvm/java-7-openjdk-amd64
apt-get -y install hadoop hadoop-hdfs hadoop-yarn hadoop-mapreduce hadoop-client openssl libhdfs0 liblzo2-2 liblzo2-dev hadoop-lzo phoenix hive hive-hcatalog tez mysql-connector-java* oozie oozie-client sqoop flume flume-agent spark spark-python spark-worker spark-yarn-shuffle

然后我复制了 /usr/lib/python2.7/dist-packages/hdinsight_common/ /usr/share/java/ /usr/lib/hdinsight-datalake/ /etc/spark/conf/ /etc/hadoop/conf/

但是当我运行 spark-shell 时，出现以下错误

java.io.IOException: No FileSystem for scheme: wasb

这是完整的堆栈 https://gist.github.com/anonymous/ebb6c9d71865c9c8e125aadbbdd6a5bc

我不确定这里缺少哪个包/jar。

有人知道我做错了什么吗？

谢谢

最佳答案

在 Spark-Shell 中设置 Azure 存储(wasb 和 wasbs 文件)的另一种方法是:

将 azure-storage 和 hadoop-azure jar 复制到 Spark 安装的 ./jars 目录中。
使用参数 —jars [以逗号分隔的列表，其中包含指向这些 jar 的路由] 运行 Spark-shell 示例:
```
$ bin/spark-shell --master "local[*]" --jars jars/hadoop-azure-2.7.0.jar,jars/azure-storage-2.0.0.jar
```

将以下行添加到 Spark 上下文:


sc.hadoopConfiguration.set("fs.azure", "org.apache.hadoop.fs.azure.NativeAzureFileSystem")
sc.hadoopConfiguration.set("fs.azure.account.key.my_account.blob.core.windows.net", "my_key")

运行一个简单的查询:


sc.textFile("wasb://my_container@my_account_host/myfile.txt").count()

享受吧:)

通过此设置，您可以轻松设置 Spark 应用程序，将参数传递到当前 Spark 上下文上的“hadoopConfiguration”

关于azure - Spark-Shell错误: No FileSystem for scheme: wasb，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/38254771/

25

4

0

文章推荐： csv - 将 csv 文件加载到 Hive 表

文章推荐： hadoop - Hive 改变 serde 属性不起作用

scheme - 无法在 Scheme 中加载文件，(使用 Simply Scheme Book 和 PLT Scheme)
我正在使用 PLT 方案 (DrScheme)。我想加载从 here 获得的文件.要加载文件，我进入 PLT Scheme 并在交互窗口(或底部窗口)中输入(加载“simply.scm”)，然后按 E
scheme - Scheme 符号区分大小写
根据我的阅读，Scheme 中的符号不区分大小写 - 即 (eq? 'Hello 'hello) 评估为 #t (因为两者都由符号 'hello 表示，并且 scheme 具有两个具有相同名称的符
scheme - Scheme 中的有限状态机
我正在尝试在 Scheme 中完成一个有限状态机。问题是，我不确定如何告诉它应该测试哪些字符。如果我想测试字符串“abc112”，我该怎么做？代码如下: #lang racket (defin
scheme - 什么:+ and :or do on Scheme?
我正在尝试做我的家庭作业，并通过一些示例代码进行破解，我看到了这一行: [(:+ (:or VAR)) (token-VAR (string->symbol lexeme))] 这是来自计算器中
scheme - Scheme 中定义表达式返回的值
我在 MIT/GNU Scheme 中运行了这个: (define x (+ 2 3)) 然后解释器打印: ;Value: x 但是根据我的教科书，define 表达式返回的值应该是未定义的。为什么解
scheme - Scheme 中的二叉树
考虑以下定义数字树的 BNF。请注意，树可以是叶子、具有一个子树的节点 1 或节点 2有两个子树。 tree ::= (’leaf number) | (’node-1 tree) | (’node-
scheme - Scheme 中的冒号
(show-data 'YHOO :config 'my-config) 我看到了一些 Scheme 代码(在 Guile 中)，如上面的行，并且对 colon 语法 :config 感到困惑。这有
scheme - Scheme 中的斐波那契数列流
我目前正在尝试理解方案中流的概念。例如，我应该编写一个函数 fibonacci，它返回斐波那契数作为流表示形式。函数的期望输出/用法如下所示: > (define a (finbonacci)) >
scheme - 在解释器中确定 Scheme 函数的定义和参数？/函数如何存储在 Scheme 中？
我想创建一个可以确定方案中任意函数定义的函数。如果我们将这样的函数称为“定义”，它会这样工作: (define (triple x) (* 3 x)) (definition triple) woul
scheme - Scheme 中的实现相关代码
在 Common Lisp 中，当我想根据 Common Lisp 实现使用不同的代码片段时，我可以使用 *features* 和提供的 #+ 和 #- 符号来检查给定功能的可用性并相应地进行。例如(
scheme - Scheme 中的解构记录
我正在学习 Scheme，具有 C/C++ 背景。我非常习惯于将相关的值组合到结构中，而且我发现 Scheme 的记录在这方面工作得很好。如果发现自己经常这样做以避免函数体中的视觉噪音: (defi
scheme - Scheme R7RS中load和include的区别
在 Scheme R7RS 中，有 load 和 include 两种形式。包含描述为: Semantics: Both include and include-ci take one or mor
scheme - Scheme 中的收集器函数是如何工作的？
我无法理解 Scheme 中收集器函数的使用。我正在使用“The Little Schemer”一书(Daniel P. Friedman 和 Matthias Felleisen 着)。一个带有一些
scheme - 在 Scheme 中获取一行用户输入？
我知道您可以使用 (read) 来获取用户输入的表达式，但是 (read) 只会获取第一个表达式，然后对任何内容进行评估。我想知道是否有任何方法可以读取整行用户输入，也许将所述行转换为列表？ (let
scheme - 如何评估从 Scheme 中的函数返回的符号？
我正在重新熟悉 Scheme，我遇到了一个问题，这可能反射(reflect)了我的根本误解。假设我在 Scheme 中执行以下操作(在这种情况下使用 Guile，但在 Chicken 中也是如此):
scheme - `if` 语句在 Scheme 中是如何工作的？
这是我目前正在自学的链接 Scheme，http://www.ccs.neu.edu/home/dorai/t-y-scheme/t-y-scheme-Z-H-1.html 据作者介绍，然后我尝试了
scheme - 你如何在 Scheme 中返回一个过程的描述？
假设我有这样的事情: (define pair (cons 1 (lambda (x) (* x x)) 如果我想返回这对的前对象，我会这样做: (car pair) 它返回 1。但是当对象是一个过程
scheme - Chibi Scheme - 简单的定义库示例不起作用
我编写了以下示例，以尝试在 Chibi Scheme 0.5.3 中使用 R7RS 库: (define-library (example hello) (export hello-world
scheme - 在 Scheme 中使用 "do"
CODE SNIPPET 1 和 CODE SNIPPET 2 有什么区别？ ;CODE SNIPPET 1 (define i 0) (do ()
scheme - 在 Scheme 中生成项链的好简单算法？
长度为 n 的 k 元项链是一个长度为 n 的有序列表，其项目是从长度为 k 的字母表中抽取的，它是所有共享轮换排序的列表中按字典顺序排列的第一个列表。例子: (1 2 3) 和 (1 3 2) 是

首页

博学

6Ren·AI

商城

azure - Spark-Shell错误: No FileSystem for scheme: wasb