gpt4 book ai didi

hadoop - 我可以自定义InputSplit以根据异常结束进行拆分

转载 作者:行者123 更新时间:2023-12-02 22:07:57 25 4
gpt4 key购买 nike

我有一个包含大量异常的大日志文件,我想编写一个自定义输入格式,以异常作为键,以异常文本作为值,我还想创建自定义拆分,以便每个映射器都能获取所有异常。

我试图创建一个自定义记录读取器,但是问题是我不知道如何创建一个自定义Get Splits方法。

最佳答案

I want to write a custom input format that gives the exception as the key and the exception text as value



足够简单-自定义记录读取器。

also i want to create custom splits so that every mapper gets all of the exception



这不是MapReduce通常的工作方式。

but the problem is that I do not know how to create a custom GetSplits method



这是在 InputFormat类中完成的,并且有很多示例。

关于hadoop - 我可以自定义InputSplit以根据异常结束进行拆分,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24146966/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com