java - Hadoop二级排序复合键compareTo与Custom Sorter比较实现-6ren

java - Hadoop二级排序复合键compareTo与Custom Sorter比较实现

转载作者：行者123 更新时间：2023-12-02 21:30:24

26

4

在Hadoop Secondary排序中，Composite中的代码具有以下方法来比较值，Composite键类实现WritableComparable:

@Override
public int compareTo(CustomKey o) {

    int result = firstName.compareTo(o.getFirstName());     
    log.debug("value is " + result);                
    if (result == 0) {
        return lastName.compareTo(o.getLastName());
    }
    return result;
}

在我们创建的自定义排序器中，执行次级排序以扩展 WritableComparator，并且代码如下所示:-

@Override
public int compare(WritableComparable w1, WritableComparable w2) {
    CustomKey key1 = (CustomKey) w1;
    CustomKey key2 = (CustomKey) w2;
    int value = key1.getFirstName().compareTo(key2.getFirstName());
    if (value == 0) {           
        return -key1.getLastName().compareTo(key2.getLastName());       
    }
    return value;
}

我想知道为什么我们要通过实现 CustomKey在 WritableComparable类中对值进行两次比较以进行一次排序，然后再创建一个 CustomSorter类来通过扩展 WritableComparator来对值进行排序。

最佳答案

我不确定您引用的代码来自哪里。

我将尝试以通用方式回答。

这是《 Hadoop最终分类指南》的摘录，

将键组合为自然键和自然值。

排序比较器应按组合键排序，即
自然键和自然值(value)。

复合键的分区程序和分组比较器应考虑
仅用于分区和分组的自然键。

对相似的键进行排序时，对它们进行分组非常有效。分组比较器就是为此目的而设计的，它有助于有效地识别相似的键块。

例:假设您从映射器中得到了以下键(复合键)。

A，1

B，2

A2

B，3

分组比较器将对此进行处理，并按如下所示对其进行排序，

A，1

A2

B，2

B，3

为了使二级排序起作用，您需要对值部分进行排序。那就是SortingComparator实现的。

最终输出为(假设您有一个分区程序，该分区程序在组合键的键部分上进行分区)

A2

A，1

B，3

B，2

关于java - Hadoop二级排序复合键compareTo与Custom Sorter比较实现，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/34504234/

26

4

0

文章推荐： Azure 容器 - 与远程容器实例上的文件交互

文章推荐： docker - Kubernetes View 服务监视器

文章推荐： docker - OpenShift 上的 pgAdmin 使用 RedHat 基本镜像

文章推荐： docker - 在 docker 文件中添加到 pgadmin 的 postgres 连接

Java:复合
我正在实现一个显示容器级别的图表。根据填充水平，线条的颜色应该改变(例如，接近最大值时应该显示红色)。我不想计算线条的不同部分并手动设置它们的颜色，而是想定义一个颜色自动改变的带。我想用自定义 Com
复合/while 循环
#include int main(void) { int days, hours, mins; float a, b, c, total, temp, tempA, tempB; a
复合 IF 语句作用域
if()//first if { if()//second if statement; } else statement; 我知道 else 与第一个 if 匹配，但我的问题是为什么？我是
delphi - 复合 "with"语句中的名称解析如何工作？
以下代码中测试了 Ready 的哪个实例，为什么？ interface type TObject1 = class ... public property Ready: boole
css - 复合 CSS？
我刚刚花了相当多的时间来寻找像这个 plunk 中的差距.问题没那么简单。这是一个动态创建的页面，一些具有 margin-bottom 的组件恰好显示在 .main 的最后。在我指责 CSS 之前，
java - 复合、按钮和图标
我的程序应该在对话中创建圆形图标。我有三个按钮，每个按钮代表要制作的图标的颜色。因此，如果我点击不同的按钮 10 次，我的程序应该创建 10 个不同颜色的圆圈。这是我的代码，分为 2 个类: impo
c - 复合/字符串文字存储在内存中的什么位置？
我读过； A compound literal is a C99 feature that can be used to create an array with no name. Consider
复合 View 中的android双布局对象
当您创建一个复合 View 并为其扩充 xml 布局文件时，如下所示: public class CompundLayout extends LinearLayout{...} 这会像这样用根扩展一个
GWT uibinder 复合 Material
我正在创建一个带有标签和文本框的复合 uibinder 小部件。预期用途是: The text to be put in the box. 我找到了如何使用自定义 @UiConstruc
design-patterns - 复合 + 责任链示例
任何人都可以举一个结合使用设计模式组合和责任链的实际例子吗？谢谢最佳答案一个非常实际的例子是 GUI 设计，例如 Qt 框架。 QObject 可以是单个对象或多个对象的组合。 QObjects
validation - 复合 View 模型对象导致远程验证失败
我在这个项目中的一些表单中使用了复合 View 模型的模式。它工作得很好。在这种情况下，我有一个 VendorAddress View 模型。我在这个项目的几个地方使用了 Address(es)，所
sql - 复合 SQL 连接？
我正在尝试构建一个我认为需要多个 JOIN 的 SQL 查询，但我不知道语法。这是每个表(带有列名)的粗略示例。 T1( key ，名称) T2(键，fkeyT1) T3(键，fkeyT2) 我想从
swt - 禁用和灰显 SWT 复合
我有一个 Composite我希望能够以编程方式启用/禁用。 Control.setEnabled(boolean enabled)方法工作正常，但它没有提供任何小部件被禁用的视觉信息。我想做的是让
php:复合 if 语句(被忽略)
如果子域不是“mobile”并且文件名不是“design”或“photo”，我想回显某些内容，因此 echo if (not“mobile”且不是“design”)或(not“mobile”而不是“照
SQLITE3 复合 "Select"语句
我有一张有几列的 table 。第 1 列和第 2 列可以包含四个 alpha 值中的任何一个:set={A,B,C,D}。我想检查每列是否包含集合中的两个值之一。所以我想简化这个陈述: SELEC
localization - 复合 C1 表单渲染器本地化
我创建了一个全局数据类型，并在页面中使用表单渲染器让用户填写数据并提交到网站。默认的英语工作正常。现在，当我尝试支持第二种语言时，我遇到了问题。根据复合文档: 1.在 ~/Frontend/Comp
java - 复合 int 键和值
我需要将自定义对象作为值存储在字典中，例如具有两个复合整数键的 datastrukturer。 (复合 ID) 我尝试使用数组作为键，但两者都不起作用，因为我猜这只是指向该数组的指针，用作键如果我能
cakephp - 用两个(复合)外键关系链接两个表
版本:3.2.1 关系表B中的两列与表A中的两列相关联。表A-> hasMany->表B 表B->属于--表A B.a_id = A.a_id B.a_name = A.a_name 食谱在食谱
localization - 复合 C1 表单渲染器本地化
我创建了一个全局数据类型，并在页面中使用表单渲染器让用户填写数据并提交到网站。默认的英语工作正常。现在，当我尝试支持第二种语言时，我遇到了问题。根据复合文档: 1.在 ~/Frontend/Comp
具有静态文件扩展名的 Log4Net 复合 RollingFileAppender
当前版本的 Log4net 是否有办法创建具有复合滚动样式的 RollingFileAppender，其中滚动文件始终保留给定的扩展名(在我的情况下为 .log)？我想要的格式示例: MyLog.l

首页

博学

6Ren·AI

商城

java - Hadoop二级排序复合键compareTo与Custom Sorter比较实现