作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
Spark 提供方法 saveAsTextFile
哪个可以存储RDD[T]
轻松进入磁盘或 HDFS。
T 是一个任意的可序列化类。
我想反转操作。
不知道有没有loadFromTextFile
它可以轻松地将文件加载到 RDD[T]
?
让我说清楚:
class A extends Serializable {
...
}
val path:String = "hdfs..."
val d1:RDD[A] = create_A
d1.saveAsTextFile(path)
val d2:RDD[A] = a_load_function(path) // this is the function I want
//d2 should be the same as d1
最佳答案
尝试使用 d1.saveAsObjectFile(path)
存储和 val d2 = sc.objectFile[A](path)
装载。
我想你不能saveAsTextFile
并读出为 RDD[A]
未经改造自 RDD[String]
关于apache-spark - 如何使用 Spark 从保存的文件中加载数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30253969/
我是一名优秀的程序员,十分优秀!