gpt4 book ai didi

scala - 使用scala将文件复制到hadoop hdfs?

转载 作者:可可西里 更新时间:2023-11-01 14:35:00 29 4
gpt4 key购买 nike

我正在尝试将本地计算机上的文件复制到我的 hdfs。但是,我不确定如何在 Scala 中执行此操作,因为我正在编写的脚本当前写入本地 CSV 文件。如何使用 scala 将此文件移动到 HDFS?

编辑:我现在做了什么:

val hiveServer = new HiveJDBC
val file = new File(TMP_DIR, fileName)
val firstRow = getFirstRow(tableName, hiveServer)
val restData = getRestData(tableName, hiveServer)
withPrintWriter(file) { printWriter =>
printWriter.write(firstRow)
printWriter.write("\n")
printWriter.write(restData)}

我现在想在 HDFS 中存储"file"

最佳答案

Scala 可以直接调用Hadoop API。例如,

    val conf = new Configuration()
val fs= FileSystem.get(conf)
val output = fs.create(new Path("/your/path"))
val writer = new PrintWriter(output)
try {
writer.write(firstRow)
writer.write("\n")
writer.write(restData)
}
finally {
writer.close()
}

关于scala - 使用scala将文件复制到hadoop hdfs?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17868588/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com