gpt4 book ai didi

hadoop - Flume 将 txt 文件转换为二进制文件

转载 作者:可可西里 更新时间:2023-11-01 17:01:32 37 4
gpt4 key购买 nike

我正在使用 Flume 假脱机目录并将文件上传到 hdfs。这些是 txt/csv 文件,我希望它们在 hdfs 中采用这种格式。但是 Flume 正在将它们加载为二进制文件...

这是我的配置:

tier1.sources  = source1
tier1.channels = channel1
tier1.sinks = sink1

tier1.sources.source1.type = spooldir
tier1.sources.source1.channels = channel1
tier1.sources.source1.spoolDir = /var/data
tier1.sources.source1.fileHeader = false
tier1.sources.source1.deletePolicy = immediate
tier1.channels.channel1.type = memory
tier1.sinks.sink1.type = hdfs
tier1.sinks.sink1.channel = channel1
tier1.sinks.sink1.hdfs.path = /user/hdfs/%y-%m-%d/
tier1.sinks.sink1.hdfs.writeFormat=Text
tier1.sinks.sink1.hdfs.useLocalTimeStamp = true
tier1.sinks.sink1.hdfs.rollInterval = 30

tier1.channels.channel1.capacity = 100

我应该更改什么以使 Flume 将 txt 文件加载为 txt 文件?

最佳答案

这应该可以解决您的问题:

tier1.sinks.sink1.hdfs.fileType = DataStream

tier1.sinks.sink1.hdfs.writeFormat = Text

关于hadoop - Flume 将 txt 文件转换为二进制文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23525996/

37 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com