gpt4 book ai didi

apache-spark - 在 Spark 中通过 SFTP 读取文件

转载 作者:行者123 更新时间:2023-12-02 21:08:42 26 4
gpt4 key购买 nike

是否可以在 spark 中使用 SFTP 读取文件?

我尝试使用 val df = sc.textFile("sftp://user:password@host/home/user/sample.csv")

但出现以下错误

scala> df.count
java.io.IOException: No FileSystem for scheme: sftp
at org.apache.hadoop.fs.FileSystem.getFileSystemClass(FileSystem.java:2584)
at org.apache.hadoop.fs.FileSystem.createFileSystem(FileSystem.java:2591)
at org.apache.hadoop.fs.FileSystem.access$200(FileSystem.java:91)
at org.apache.hadoop.fs.FileSystem$Cache.getInternal(FileSystem.java:2630)

有什么方法可以在 spark 中使用 sftp 读取文件吗?

最佳答案

我们创建了一个非常简单的 spark SFTP 连接器来执行此操作。

这是 github 链接 https://github.com/springml/spark-sftp

它也已发布到 spark-packages。 http://spark-packages.org/package/springml/spark-sftp

关于apache-spark - 在 Spark 中通过 SFTP 读取文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34676374/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com