- android - RelativeLayout 背景可绘制重叠内容
- android - 如何链接 cpufeatures lib 以获取 native android 库?
- java - OnItemClickListener 不起作用,但 OnLongItemClickListener 在自定义 ListView 中起作用
- java - Android 文件转字符串
我在 hadoop 中做了一个练习,用于对对象“IntPair”进行排序,它是 2 个整数的组合。这是输入文件:
2,9
3,8
2,6
3,2
...
'IntPair' 类是这样的:
static class IntPair implements WritableComparable<IntPair> {
private int first;
private int second;
...
public int compareTo(IntPair o) {
return (this.first==o.first)?(this.second==o.second?0:(this.second>o.second?1:-1)):(this.first>o.first?1:-1);
}
public static int compare(int a, int b) {
return (a==b)?0:((a>b)?1:-1);
}
...
}
在 Mapper 中,我使用了 inputFormat 和 outputKey/Value,并且只创建了每行 2 个整数的 IntPair 实例:
protected void map(LongWritable key, Text value, Context context)
throws IOException, InterruptedException {
String v[] = value.toString().split(",");
IntPair k = new IntPair(Integer.parseInt(v[0]), Integer.parseInt(v[1]));
context.write(k, NullWritable.get());
}
我根据第一个整数对映射器结果进行分区,并根据第一个整数创建组比较器。只有排序比较器基于两个整数。
static class FirstPartitioner extends Partitioner<IntPair, NullWritable> {
public int getPartition(IntPair key, NullWritable value, int numPartitions) {
return Math.abs(key.getFirst()*127)%numPartitions;
}
}
static class BothComparator extends WritableComparator {
public int compare(WritableComparable w1, WritableComparable w2) {
IntPair p1 = (IntPair)w1;
IntPair p2 = (IntPair)w2;
int cmp = IntPair.compare(p1.getFirst(), p2.getFirst());
if(cmp != 0) {
return cmp;
}
return -IntPair.compare(p1.getSecond(), p2.getSecond());//reverse sort
}
}
static class FirstGroupComparator extends WritableComparator {
public int compare(WritableComparable w1, WritableComparable w2) {
IntPair p1 = (IntPair)w1;
IntPair p2 = (IntPair)w2;
return IntPair.compare(p1.getFirst(), p2.getFirst());
}
}
在 Reducer 中,我只输出 IntPair 作为键,输出 NullWritable 作为值:
static class SSReducer extends Reducer<IntPair, NullWritable, IntPair, NullWritable> {
protected void reduce(IntPair key, Iterable<NullWritable> values,
Context context)throws IOException, InterruptedException {
context.write(key, NullWritable.get());
}
}
运行hadoop后得到如下结果:
2,9
3,8
之前,我认为reducer应该通过键(IntPair)对记录进行分组。由于每条记录代表一个不同的键,因此每条记录将调用方法“reduce”一次,在这种情况下结果应该是:
2,9
2,6
3,8
3,2
所以我认为差异的存在是因为组比较器,因为它只使用第一个整数进行比较。所以在 reducer 中,记录按第一个整数分组。在此示例中,这意味着 2 条记录中的每条记录都调用“reduce”一次,因此在不循环的情况下,它只生成每组的第一条记录。这样对吗?另外,我做了另一个实验,改变了 reducer 如下:
static class SSReducer extends Reducer<IntPair, NullWritable, IntPair, NullWritable> {
protected void reduce(IntPair key, Iterable<NullWritable> values,
Context context)throws IOException, InterruptedException {
for(NullWritable n : values) //add looping
context.write(key, NullWritable.get());
}
}
然后它产生的结果中有 4 个项目。
如果我将 groupcomparator 更改为使用两个整数进行比较,它也会产生 4 个项目。因此,reducer 实际上使用 groupcomparator 对键进行分组,这意味着即使键不同,一个组中的每个记录都会调用一次“reduce”。
最佳答案
是的,即使 key 不同,一组中的每个记录都会调用“reduce”一次。实际上,每个组调用一次 reduce 方法,组中的第一个键为 'KEY',组中的所有值构成 reduce 方法的值。
即使我们在 reduce 方法中只有一个键(第一个键)并且所有值都是可迭代的,您可以看到在迭代时我们将获得与可迭代中的值对应的键。
首先,我们使用两个键转到 groupcomparator,reduce 方法开始,然后从迭代器内部再次使用另外 2 个键调用组比较器。
这意味着 reducer 事先不知道它的可迭代值。它是在迭代可迭代值时确定的。
因此,如果我们不迭代值,我们只会看到组中的第一个键。如果我们迭代值,我们将获得所有键。
关于hadoop - 一组中的所有记录都调用一次 'reduce' 吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12932023/
为了让我的代码几乎完全用 Jquery 编写,我想用 Jquery 重写 AJAX 调用。 这是从网页到 Tomcat servlet 的调用。 我目前情况的类似代码: var http = new
我想使用 JNI 从 Java 调用 C 函数。在 C 函数中,我想创建一个 JVM 并调用一些 Java 对象。当我尝试创建 JVM 时,JNI_CreateJavaVM 返回 -1。 所以,我想知
环顾四周,我发现从 HTML 调用 Javascript 函数的最佳方法是将函数本身放在 HTML 中,而不是外部 Javascript 文件。所以我一直在网上四处寻找,找到了一些简短的教程,我可以根
我有这个组件: import {Component} from 'angular2/core'; import {UserServices} from '../services/UserService
我正在尝试用 C 实现一个简单的 OpenSSL 客户端/服务器模型,并且对 BIO_* 调用的使用感到好奇,与原始 SSL_* 调用相比,它允许一些不错的功能。 我对此比较陌生,所以我可能会完全错误
我正在处理有关异步调用的难题: 一个 JQuery 函数在用户点击时执行,然后调用一个 php 文件来检查用户输入是否与数据库中已有的信息重叠。如果是这样,则应提示用户确认是否要继续或取消,如果他单击
我有以下类(class)。 public Task { public static Task getInstance(String taskName) { return new
嘿,我正在构建一个小游戏,我正在通过制作一个数字 vector 来创建关卡,该数字 vector 通过枚举与 1-4 种颜色相关联。问题是循环(在 Simon::loadChallenge 中)我将颜
我有一个java spring boot api(数据接收器),客户端调用它来保存一些数据。一旦我完成了数据的持久化,我想进行另一个 api 调用(应该处理持久化的数据 - 数据聚合器),它应该自行异
首先,这涉及桌面应用程序而不是 ASP .Net 应用程序。 我已经为我的项目添加了一个 Web 引用,并构建了各种数据对象,例如 PayerInfo、Address 和 CreditCard。但问题
我如何告诉 FAKE 编译 .fs文件使用 fsc ? 解释如何传递参数的奖励积分,如 -a和 -target:dll . 编辑:我应该澄清一下,我正在尝试在没有 MSBuild/xbuild/.sl
我使用下划线模板配置了一个简单的主干模型和 View 。两个单独的 API 使用完全相同的配置。 API 1 按预期工作。 要重现该问题,请注释掉 API 1 的 URL,并取消注释 API 2 的
我不确定什么是更好的做法或更现实的做法。我希望从头开始创建目录系统,但不确定最佳方法是什么。 我想我在需要显示信息时使用对象,例如 info.php?id=100。有这样的代码用于显示 Game.cl
from datetime import timedelta class A: def __abs__(self): return -self class B1(A):
我在操作此生命游戏示例代码中的数组时遇到问题。 情况: “生命游戏”是约翰·康威发明的一种细胞自动化技术。它由一个细胞网格组成,这些细胞可以根据数学规则生存/死亡/繁殖。该网格中的活细胞和死细胞通过
如果我像这样调用 read() 来读取文件: unsigned char buf[512]; memset(buf, 0, sizeof(unsigned char) * 512); int fd;
我用 C 编写了一个简单的服务器,并希望调用它的功能与调用其他 C 守护程序的功能相同(例如使用 ./ftpd start 调用它并使用 ./ftpd stop 关闭该实例)。显然我遇到的问题是我不知
在 dos 中,当我粘贴此命令时它会起作用: "C:\Program Files (x86)\Google\Chrome\Application\chrome.exe" https://google.
在 dos 中,当我粘贴此命令时它会起作用: "C:\Program Files (x86)\Google\Chrome\Application\chrome.exe" https://google.
我希望能够从 cmd 在我的 Windows 10 计算机上调用 python3。 我已重新安装 Python3.7 以确保选择“添加到路径”选项,但仍无法调用 python3 并使 CMD 启动 P
我是一名优秀的程序员,十分优秀!