作者热门文章
- android - RelativeLayout 背景可绘制重叠内容
- android - 如何链接 cpufeatures lib 以获取 native android 库?
- java - OnItemClickListener 不起作用,但 OnLongItemClickListener 在自定义 ListView 中起作用
- java - Android 文件转字符串
独立程序可以通过使用 AWS 客户端 jar 文件在没有 Hadoop 的情况下读取/写入 AWS S3 文件。 Spark 程序可以在没有 Hadoop 的情况下读/写文件。然而,Spark 需要读取/写入 AWS S3 文件的程序才能使用 Hadoop。即便如此,即使设置了 Hadoop 目录,Spark 1.4 和 Hadoop 2.6 & 2.7 仍会出现关于缺少 S3 的 Hadoop 类的运行时错误。
Spark 程序是否可以通过 AWS 客户端 jar 文件在不使用 Hadoop 的情况下读取/写入 S3 文件?
如果不是,我该如何解决 Spark 在运行时缺少 Hadoop 的 S3 类的问题?
最佳答案
Spark 使用 Hadoop 类来读取 S3,但它不需要安装 Hadoop(我们使用的是为 Hadoop 2.4 版本预构建的)。只需确保使用 s3n://
前缀
关于hadoop - 有没有办法让 Spark 在不使用 Hadoop 的情况下读取 AWS S3 文件?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31633793/
我是一名优秀的程序员,十分优秀!