gpt4 book ai didi

csv - hadoop mapreduce如何从CSV文件中获取数据输入?

转载 作者:可可西里 更新时间:2023-11-01 14:47:04 28 4
gpt4 key购买 nike

我想实现 hadoop mapreduce,我使用 csv 文件作为输入。所以,我想问一下,hadoop有没有提供什么方法​​可以用来获取csv文件的值,还是我们直接用Java Split String函数来实现?

谢谢大家......

最佳答案

默认情况下,Hadoop 使用文本输入阅读器从输入文件中逐行输入映射器。映射器中的关键是读取的行数。但是请注意 CSV 文件,因为单个列/字段可以包含换行符。您可能想要寻找像这样的 CSV 输入阅读器:

https://github.com/mvallebr/CSVInputFormat/blob/master/src/main/java/org/apache/hadoop/mapreduce/lib/input/CSVNLineInputFormat.java

但是,您必须在代码中拆分行。

关于csv - hadoop mapreduce如何从CSV文件中获取数据输入?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28738837/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com