gpt4 book ai didi

java - Hadoop map-reduce 输出包含奇怪的字符

转载 作者:可可西里 更新时间:2023-11-01 16:34:17 25 4
gpt4 key购买 nike

我正在运行 map 缩减作业。当我在我的单节点集群机器上运行它时,输出如下所示

hduser@nikhil-VirtualBox:/usr/local/hadoop/hadoop-1.0.4$ bin/hadoop dfs -text /user/hduser/output16/part-r-00000
0 Required Genotype column (s), Must not contain NULLS for required fields, failed, 5, 1: GENE_NAME; 2: GENE_NAME; 4: GENE_NAME; 5: GENE_NAME; 9: GENE_NAME

但是,当我在 Amazon EMR 上对更大的数据集运行相同的操作时,我得到以下所有奇怪的字符。可能是什么原因?

SEQorg.apache.hadoop.io.Textorg.apache.hadoop.io.Text\00\00\00\00\00\00\968\D6\FA\E1>X(.q\8B!\ABQ\00\00-\00\00\00
1537044153\8ERequired Genotype column (s), Must not contain NULLS for required fields, failed, 1, 1: VARIANT_START_POSITION; 2: VARIANT_START_POSITION;

最佳答案

header (SEQTextText) 告诉您这是一个 SequenceFile,以 org.apache.hadoop.io.Text 作为键和值。

所以这是二进制而非纯文本,您可以使用 SequenceFile.Reader 读取它。

关于java - Hadoop map-reduce 输出包含奇怪的字符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13370960/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com