java - 由于 Task attempt failed to report status 600 秒，reduce 失败。杀戮!解决方案？

转载作者：可可西里更新时间：2023-11-01 14:15:54

作业的 reduce 阶段失败并显示:

失败的 Reduce 任务超出了允许的限制。

每个任务失败的原因是:

任务 attempt_201301251556_1637_r_000005_0 未能报告状态达 600 秒。杀!

问题详情:

Map 阶段接收格式为:time, rid, data 的每条记录。

数据的格式为:数据元素及其计数。

例如:a,1 b,4 c,7对应一条记录的数据。

映射器为每个数据元素输出每条记录的数据。例如:

key:(time, a,), val: (rid,data)键:(时间，b，)，val:(删除，数据)key:(time, c,), val: (rid,data)

每一个reduce从所有的记录中接收同一个key对应的所有数据。例如:键:(时间，a)，值:(rid1，数据)和键:(时间，a)，值:(rid2，数据)到达相同的 reduce 实例。

它在这里做了一些处理并输出了类似的 rids。

对于 10MB 这样的小数据集，我的程序运行没有问题。但由于上述原因，当数据增加到 1G 时失败。我不知道为什么会这样。请帮忙!

减少代码:

下面有两个类:

VCLReduce0Split
核心拆分

一个。 VCLReduce0SPlit

public class VCLReduce0Split extends MapReduceBase implements Reducer<Text, Text, Text, Text>{
    //  @SuppressWarnings("unchecked")
        public void reduce (Text key, Iterator<Text> values, OutputCollector<Text, Text> output, Reporter reporter) throws IOException {

            String key_str = key.toString();
            StringTokenizer stk = new StringTokenizer(key_str);
            String t = stk.nextToken();

            HashMap<String, String> hmap = new HashMap<String, String>();

            while(values.hasNext())
            {
                StringBuffer sbuf1 = new StringBuffer(); 
                String val = values.next().toString();
                StringTokenizer st = new StringTokenizer(val);

                String uid = st.nextToken();

                String data = st.nextToken();

                     int total_size = 0;

                     StringTokenizer stx = new StringTokenizer(data,"|");

                     StringBuffer sbuf = new StringBuffer();

                     while(stx.hasMoreTokens())
                     {
                         String data_part = stx.nextToken();
                         String data_freq = stx.nextToken();

                    //   System.out.println("data_part:----->"+data_part+" data_freq:----->"+data_freq);
                         sbuf.append(data_part);
                         sbuf.append("|");
                         sbuf.append(data_freq);
                         sbuf.append("|");
                     }
                /*     
                     for(int i = 0; i<parts.length-1; i++)
                     {
                         System.out.println("data:--------------->"+data);
                         int part_size = Integer.parseInt(parts[i+1]);
                         sbuf.append(parts[i]);
                         sbuf.append("|");
                         sbuf.append(part_size);
                         sbuf.append("|");
                         total_size = part_size+total_size;
                         i++;
                     }*/

                sbuf1.append(String.valueOf(total_size));
                sbuf1.append(",");
                sbuf1.append(sbuf);
                if(uid.equals("203664471")){
                //  System.out.println("data:--------------------------->"+data+" tot_size:---->"+total_size+" sbuf:------->"+sbuf);
                }
                hmap.put(uid, sbuf1.toString());

            }

            float threshold = (float)0.8;

            CoreSplit obj = new CoreSplit();


            ArrayList<CustomMapSimilarity> al = obj.similarityCalculation(t, hmap, threshold);

            for(int i = 0; i<al.size(); i++)
            {
                CustomMapSimilarity cmaps = al.get(i);
                String xy_pair = cmaps.getRIDPair();
                String similarity = cmaps.getSimilarity();
                output.collect(new Text(xy_pair), new Text(similarity));
            }


         }
    }

b。 核心拆分

package com.a;

import java.util.ArrayList;
import java.util.HashMap;
import java.util.HashSet;
import java.util.Iterator;
import java.util.Set;
import java.util.StringTokenizer;
import java.util.TreeMap;

import org.apache.commons.collections.map.MultiValueMap;

public class PPJoinPlusCoreOptNewSplit{


     public ArrayList<CustomMapSimilarity> similarityCalculation(String time, HashMap<String,String>hmap, float t)
     {

         ArrayList<CustomMapSimilarity> als = new ArrayList<CustomMapSimilarity>();
         ArrayList<CustomMapSimilarity> alsim = new ArrayList<CustomMapSimilarity>();

        Iterator<String> iter = hmap.keySet().iterator();

        MultiValueMap index = new MultiValueMap();

        String RID;
        TreeMap<String, Integer> hmap2;
        Iterator<String> iter1;

        int size;
        float prefix_size;
        HashMap<String, Float> alpha;
        HashMap<String, CustomMapOverlap> hmap_overlap;

        String data;

        while(iter.hasNext())
            {
                RID = (String)iter.next();

                String data_val = hmap.get(RID);

                StringTokenizer st = new StringTokenizer(data_val,",");
            //    System.out.println("data_val:--**********-->"+data_val+" RID:------------>"+RID+" time::---?"+time);
                String RIDsize = st.nextToken();
                size = Integer.parseInt(RIDsize);
                data = st.nextToken();


                StringTokenizer st1 = new StringTokenizer(data,"\\|");


                String[] parts = data.split("\\|");

            //  hmap2 = (TreeMap<String, Integer>)hmap.get(RID);
        //      iter1 = hmap2.keySet().iterator();

            //  size = hmap_size.get(RID);

                prefix_size = (float)(size-(0.8*size)+1); 

                if(size==1)
                {
                    prefix_size = 1;
                }

                alpha = new HashMap<String, Float>();

                hmap_overlap = new HashMap<String, CustomMapOverlap>();

        //      Iterator<String> iter2 = hmap2.keySet().iterator();

                int prefix_index = 0;

                int pi=0;

                for(float j = 0; j<=prefix_size; j++)
                {

                    boolean prefix_chk = false;
                    prefix_index++;
                    String ptoken = parts[pi];
            //      System.out.println("data:---->"+data+" ptoken:---->"+ptoken);
                    float val = Float.parseFloat(parts[pi+1]);
                    float temp_j = j;
                     j = j+val;
                     boolean j_l = false ;
                     float prefix_contri = 0;
                     pi= pi+2;

                     if(j>prefix_size)
                        {

                            // prefix_contri = j-temp_j;
                             prefix_contri = prefix_size-temp_j;

                            if(prefix_contri>0)
                            {
                                 j_l = true;
                                 prefix_chk = false;

                            }
                            else
                            {
                                prefix_chk = true;                              
                            }
                        }                   


                    if(prefix_chk == false){


                        filters(index, ptoken, RID, hmap,t, size, val, j_l, alpha, hmap_overlap, j, prefix_contri);


                    CustomMapPrefixTokens cmapt = new CustomMapPrefixTokens(RID,j);
                    index.put(ptoken, cmapt);

                }

            }


                als = calcSimilarity(time, RID, hmap, alpha, hmap_overlap);

                for(int i = 0; i<als.size(); i++)
                {
                    if(als.get(i).getRIDPair()!=null)
                    {
                        alsim.add(als.get(i));

                    }
                }

            }

         return alsim;

     }


     public void filters(MultiValueMap index, String ptoken, String RID, HashMap<String, String> hmap, float t, int size, float val, boolean j_l, HashMap<String, Float> alpha, HashMap<String, CustomMapOverlap> hmap_overlap, float j, float prefix_contri)
     {
            @SuppressWarnings("unchecked")

            ArrayList<CustomMapPrefixTokens> positions_list = (ArrayList<CustomMapPrefixTokens>) index.get(ptoken);

            if((positions_list!=null) &&(positions_list.size()!=0))
            {

                CustomMapPrefixTokens cmapt ;
                String y;
                Iterator<String> iter3;
                int y_size = 0;
                float check_size = 0;
            //  TreeMap<String, Integer> hmapy;
                float RID_val=0;
                float y_overlap = 0;
                float ubound = 0;
                ArrayList<Float> fl = new ArrayList<Float>();

              StringTokenizer st;

            for(int k = 0; k<positions_list.size(); k++)
            {
                cmapt = positions_list.get(k);

                if(!cmapt.getRID().equals(RID))
                {

                 y = hmap.get(cmapt.getRID());

                // iter3 = y.keySet().iterator();

                 String yRID = cmapt.getRID();

                 st = new StringTokenizer(y,",");

                 y_size = Integer.parseInt(st.nextToken());

                 check_size = (float)0.8*(size);

                if(y_size>=check_size)
                {

                    //hmapy = hmap.get(yRID);

                    String y_data = st.nextToken();

                    StringTokenizer st1 = new StringTokenizer(y_data,"\\|");


                    while(st1.hasMoreTokens())
                    {
                        String token = st1.nextToken();
                        if(token.equals(ptoken))
                        {

                            String nxt_token = st1.nextToken();
                    //      System.out.println("ydata:--->"+y_data+" nxt_token:--->"+nxt_token);
                            RID_val = (float)Integer.parseInt(nxt_token);
                            break;
                        }
                    }

                 //    RID_val = (float) hmapy.get(ptoken); 
                     float alpha1 = (float)(0.8/1.8)*(size+y_size);

                     fl = overlapCalc(alpha1, size, y_size, cmapt, j, alpha, j_l,RID_val,val,prefix_contri);

                     ubound = fl.get(0);
                     y_overlap = fl.get(1);


                    positionFilter(ubound, alpha1, cmapt, y_overlap, hmap_overlap);

                  }

                }   
            }
        }



     }


   public void positionFilter( float ubound,float alpha1, CustomMapPrefixTokens cmapt, float y_overlap, HashMap<String, CustomMapOverlap> hmap_overlap)
   {

     float y_overlap_total = 0;

            if(null!=hmap_overlap.get(cmapt.getRID()))
            {

            y_overlap_total = hmap_overlap.get(cmapt.getRID()).getOverlap();

            if((y_overlap_total+ubound)>=alpha1)
            {

                CustomMapOverlap cmap_tmp = hmap_overlap.get(cmapt.getRID());

                float y_o_t = y_overlap+y_overlap_total;

                cmap_tmp.setOverlap(y_o_t);
                hmap_overlap.put(cmapt.getRID(),cmap_tmp);

            }
            else
            {
                float n = 0;
                hmap_overlap.put(cmapt.getRID(), new CustomMapOverlap(cmapt.getRID(),n));
            }

            }
            else
            {
                CustomMapOverlap cmap_tmp = new CustomMapOverlap(cmapt.getRID(),y_overlap);
                hmap_overlap.put(cmapt.getRID(), cmap_tmp);

            }

   }

   public ArrayList<Float> overlapCalc(float alpha1, int size, int y_size, CustomMapPrefixTokens cmapt, float j, HashMap<String, Float> alpha, boolean j_l, float RID_val, float val, float prefix_contri )
   {

            alpha.put(cmapt.getRID(), alpha1);
            float min1 = y_size-cmapt.getPosition();
            float min2 = size-j;
            float min = 0;

            float y_overlap = 0;

            if(min1<min2)
            {
                min = min1;
            }
            else
            {
                min = min2;
            }
            if(j_l==true)
            {
                val = prefix_contri;    
            }                                       
            if(RID_val<val)
            {
                y_overlap = RID_val;
            }
            else
            {
                y_overlap = val;
            }

            float ubound = y_overlap+min;

            ArrayList<Float> fl = new ArrayList<Float>();
            fl.add(ubound);
            fl.add(y_overlap);

            return fl;

   }


     public ArrayList<CustomMapSimilarity> calcSimilarity( String time, String RID, HashMap<String,String> hmap , HashMap<String, Float> alpha, HashMap<String, CustomMapOverlap> hmap_overlap)
     {

         float jaccard = 0;

         CustomMapSimilarity cms = new CustomMapSimilarity(null, null);   
         ArrayList<CustomMapSimilarity> alsim = new ArrayList<CustomMapSimilarity>();

        Iterator<String> iter = hmap_overlap.keySet().iterator();

        while(iter.hasNext())
        {
            String key = (String)iter.next();

            CustomMapOverlap val = (CustomMapOverlap)hmap_overlap.get(key);

            float overlap = (float)val.getOverlap();

            if(overlap>0)
            {

               String yRID = val.getRID();

              String RIDpair = RID+" "+yRID;

             jaccard = unionIntersection(hmap, RIDpair);

             if(jaccard>0.8)
                {
                    cms = new CustomMapSimilarity(time+" "+RIDpair, String.valueOf(jaccard));
                    alsim.add(cms);
                }

            }

        }

         return alsim;

     }


     public float unionIntersection( HashMap<String,String> hmap, String RIDpair)
     {


            StringTokenizer st = new StringTokenizer(RIDpair);

            String xRID = st.nextToken();

            String yRID = st.nextToken();

            String xdata = hmap.get(xRID);

            String ydata = hmap.get(yRID);


            int total_union = 0;

            int xval = 0;
            int yval = 0;
            int part_union = 0;

            int total_intersect = 0;

        //  System.out.println("xdata:------*************>"+xdata);

            StringTokenizer xtokenizer = new StringTokenizer(xdata,",");
            StringTokenizer ytokenizer = new StringTokenizer(ydata,",");
        //  String[] xpart = xdata.split(",");
        //  String[] ypart = ydata.split(",");

            xtokenizer.nextToken();
            ytokenizer.nextToken();

            String datax = xtokenizer.nextToken();
            String datay = ytokenizer.nextToken();


            HashMap<String,Integer> x = new HashMap<String, Integer>();
            HashMap<String,Integer> y = new HashMap<String, Integer>();


            String [] xparts;

                 xparts = datax.toString().split("\\|");


              String [] yparts;

                 yparts = datay.toString().split("\\|");


                 for(int i = 0; i<xparts.length-1; i++)
                 {
                     int part_size = Integer.parseInt(xparts[i+1]);
                     x.put(xparts[i], part_size);

                     i++;
                 }

                 for(int i = 0; i<yparts.length-1; i++)
                 {
                     int part_size = Integer.parseInt(yparts[i+1]);
                     y.put(xparts[i], part_size);

                     i++;
                 }


             Set<String> xset = x.keySet();
             Set<String> yset = y.keySet();

            for(String elm:xset )
            {

                yval = 0;

                xval = (Integer)x.get(elm);

                part_union = 0;
                int part_intersect = 0;
                if(yset.contains(elm)){

                    yval = (Integer) y.get(elm);

                if(xval>yval)
                {
                    part_union = xval;
                    part_intersect = yval;
                }
                else
                {
                    part_union = yval;
                    part_intersect = xval;
                }
                total_intersect = total_intersect+part_intersect;
                }
                else
                {
                    part_union = xval;
                }

                total_union = total_union+part_union;


            }


            for(String elm: yset)
            {
                part_union = 0;

                if(!xset.contains(elm))
                {
                    part_union = (Integer) y.get(elm);
                    total_union = total_union+part_union;
                }

            }

            float jaccard = (float)total_intersect/total_union;

         return jaccard;

     }

}

最佳答案

超时的原因可能是您的 reducer 中的长时间运行计算没有将进度报告回 Hadoop 框架。这可以使用不同的方法解决:

我。在 mapred-site.xml 中增加超时:

<property>
  <name>mapred.task.timeout</name>
  <value>1200000</value>
</property>

默认值为 600000 毫秒 = 600 秒。

二。在 Reducer example in javadoc 中每隔 x 条记录报告进度:

public void reduce(K key, Iterator<V> values,
                          OutputCollector<K, V> output, 
                          Reporter reporter) throws IOException {
   // report progress
   if ((noValues%10) == 0) {
     reporter.progress();
   }

   // ...
}

您可以选择增加自定义计数器，如 example :

reporter.incrCounter(NUM_RECORDS, 1);

关于java - 由于 Task attempt failed to report status 600 秒，reduce 失败。杀戮!解决方案？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/15281307/

文章推荐： hadoop - avro gradle 插件示例使用

文章推荐： Hadoop- hive : Delete data which is older than specified no of days

文章推荐： hadoop - Namenode-HDFS "Connection refused"错误(Hadoop 问题)

文章推荐： windows - CRT，我们还需要重新分配它吗？

reporting-services - 报告迁移 : Crystal Reports (Rpt) to Sql Reports (Rdl)
是否有将 Crystal Reports .rpt 文件转换为 SQL Reporting 2008 .rdl 文件的免费软件？最佳答案您很快就会发现，由于 Crystal 许可限制，这是不允许的
crystal-reports - 从 Crystal Reports 8 迁移到 Crystal Reports 2008
如何将 Crystal Reports 8.0 迁移到 Crystal Reports 2008？ 8.0的存储过程的 Crystal 报表在2008年不执行，有人可以帮忙吗？我们正在使用 Seag
crystal-reports - 在没有 Crystal Reports Server 的情况下在 Crystal Reports 之间共享函数？
我们有几个执行相同格式操作的报告(例如，如果值在特定范围内，则显示“通过”或“失败”。) 如果没有 Crystal Reports Server，有没有办法在报表之间共享功能，以便它们不需要重复？我知
reporting-services - 比较 SQL Server Reporting Services 与 Crystal Reports
就目前而言，这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持，但这个问题可能会引起辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开，visit the he
report - 是否可以更改 Allure Reports 中的日期格式？
我的 Allure 报告以 MM/dd/yyyy 格式显示日期。我想将格式更改为 dd/MM/yyyy。是否可以在 Allure 报告中设置不同的日期格式？最佳答案是的，您可以在 settings
reporting-services - Reporting Services - 有条件地隐藏矩阵列
在矩阵报告中是否可以根据父组的值隐藏列？例如，我有一个名为“value”的列，当包含它的列组具有特定值时，我想隐藏它。最佳答案对的，这是可能的。如果您单击该组并在“可见性”选项卡下编辑其属性，您
crystal-reports - Crystal Reports 打印空白页
我有一个 Crystal 报告，它正在打印一个空白页并可以很好地打印报告，但只是使用了这个额外的页面。完成我的研究，勾选、取消勾选并将正确的公式添加到“新页面之后”选项中，而不是在最后一条记录公式等
jasper-reports - Jasper Report 在填充整个文本字段之前截断文本
我的 PDF 报告有问题，在填充文本字段之前，文本字段中的字符串被截断。丢失字符的数量 (5-6) 不足以超过 textField 的末尾. 我添加了 text.truncate.at.char属性添
crystal-reports - Crystal Reports - 基于数据隐藏文本和绘图对象
如果数据字段“IsVisible”设置为 1，我在 Crystal Report 上有一个文本和绘图，我想隐藏它。有没有简单的方法来做到这一点？最佳答案您可以通过转到“部分专家”-> 选择所需部分
crystal-reports - Crystal Reports 中交叉表报表的行标题
我设计了一个 Crystal 交叉表报告。它是这样显示的 col1 col2 col3 行1 行11 val1 val2 val3 行2 行21 val1 val2 val3 但我也想要
crystal-reports - Crystal Reports - 安装到开发机器时被阻止的端口？
我刚刚购买了最新版本的 SAP Crystal Reports，并从他们的网站下载了它。我正在尝试运行 Setup.exe 程序，但是一旦我双击它，我就会收到一条 fatal error 消息，指出
crystal-reports - Crystal Reports 中的多个组
如何在 Crystal Reports 中使用多个非嵌套组？我想做的一个小例子: - 租车头 --rentals 标题(组) ---出租时间为 01-02-2008 至 01-06-2008 ---
crystal-reports - Crystal Report 中多列的总页数
我有一个多列 Crystal 报告，现在我想显示重量和数量列的运行总计。实际报告的图片是这个但是 Crystal 报表设计器不显示其他列，所以我应该在哪一列计算值。最佳答案遵循这种方法: 使用以
crystal-reports - Crystal Reports - 汇总与运行总计字段
在 Crystal Reports 中，运行总计字段和汇总字段有什么区别？ (在 Crystal IDE 中，汇总字段位于插入 -> 汇总。可以在字段资源管理器中添加运行总计) (版本 11.5) 最
crystal-reports - Crystal Reports - 计数公式
我正在用 Crystal 开发一份报告，我需要对具有多种不同状态的特定字段进行计数。例如，我的报告中有一个“StatusType”字段，其中包含的值是 "In Process", "Rejected"
reporting-services - Reporting Services 图像在部署报表后不显示
我有一份 SSRS 2005 报告，其中包含许多图像。我包含图像的方式是我有一个图像对象，其 URL 设置在 value 属性中。实际图像由同一台服务器上的 IIS 虚拟目录托管。我这样做是因为我需要
jasper-reports - Jasper Reports - 组更改时打印
我正在尝试打印组的最后一条记录，但表达式 print when group changes: True似乎不起作用。它只是打印该组的所有记录。 (我已经根据用户名对记录进行了分组)。最佳答案我遇到
reporting-services - Reporting Services - 根据参数动态设置字段值
我需要构建一个报告，以四个分组级别显示数据。棘手的部分是:要在这四个级别上显示的实际字段将作为参数传递到报告中。我现在的主要问题是:如何告诉报告上的文本框不显示参数@X 的值，而是按参数@X 中指定
reporting-services - Reporting Services - 确定矩阵中显示的列数
是否可以确定 Reporting Services 报表中显示的列数，并在单独文本框的可见性表达式中使用它？我面临以下情况: 我的客户有一个 Reporting Services 2005 报告，其
reporting-services - Reporting Services - 从右到左对齐矩阵
在 RS 报告中，我有一个矩阵，其 LayoutDirection 属性设置为 RTL(因为它是希伯来语)。我通过从数据集字段列表中拖动一个字段并将其放在矩阵的列标题中来创建一个列组。所以列数是可变的

可可西里

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

java - 由于 Task attempt failed to report status 600 秒，reduce 失败。杀戮!解决方案？

失败的 Reduce 任务超出了允许的限制。