hadoop - hadoop mapreduce.partition.keypartitioner.options不起作用-6ren

hadoop - hadoop mapreduce.partition.keypartitioner.options不起作用

转载作者：行者123 更新时间：2023-12-02 22:02:40

25

4

我只想在key的第一个字段与reducer相同的位置对数据进行分区。例如，[ 11 * * * ] data。
但是似乎keypartitioner不起作用，我真的不知道为什么。

环境

Hadoop版本

代码run.sh在这里--->

#!/usr/bin/sh


hadoop fs -rm -r /training/likang/tmp2
hadoop fs -rm /training/likang/tmp/testfile
hadoop fs -put testfile1 /training/likang/tmp/testfile


hadoop-streaming -D stream.map.output.field.separator="\t" \
                -D stream.num.map.output.key.fields=2 \
                -D map.output.key.field.separator="\t" \
                -D mapreduce.partition.keypartitioner.options=-k1,1 \
                -D mapreduce.job.maps=2 \
                -D mapreduce.job.reduces=2 \
                -D mapred.job.name="lk_filt_rid" \
                -partitioner org.apache.hadoop.mapred.lib.KeyFieldBasedPartitioner \
                -input /training/likang/tmp/testfile \
                -output /training/likang/tmp2 \
                -mapper "cat" -reducer "cat"

hadoop fs -cat /training/likang/tmp2/part-00000
echo "------------------"
hadoop fs -cat /training/likang/tmp2/part-00001

输入文件为testfile1 --->

11  5   333 111
11  5   777 000
11  3   888 999
11  9   988 888
11  7   234 2342
11  5   4   4
15  9   230 134
12  8   232 834
15  77  220 000
15  33  256 399
11  5   999 888
15  9   222 111
14  88  372 233
15  9   66  77
11  5   821 221
11  0   11  11
15  0   22  22
12  0   33  33
14  0   44  44

结果是，所有的 [ 11 * * * * ]数据都没有发送到相同的reducer。有人知道为什么吗？谢谢。

最佳答案

现在我知道，删除此行很有用

-D map.output.key.field.separator="\t" \

删除此选项后，结果将是正确的，但由于该原因而更加混乱。
map.output.key.field.separator的默认值似乎只是一个Tab，但是在我在这里写完之后，这会导致错误.........

关于hadoop - hadoop mapreduce.partition.keypartitioner.options不起作用，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/52051615/

25

4

0

文章推荐： hadoop - hdfs dfs -test/dir_name的作用是什么？

文章推荐： MSDTC/DTCPing 仅在一个方向上工作

文章推荐： javascript - 从 Vuejs 中动态创建的数组中的对象中检索值

文章推荐： printing - 在 'showpage'之前注入(inject)PostScript代码

javascript - `var options = options || {}` 和 `options || (options = {})` 之间的区别
我经常使用 var options = options || {} 作为默认为空对象的方式。它通常用于初始化选项对象，以防它未在函数调用的参数中传递。问题是我在几个地方(博客文章、源代码)读到opt
rust - 比赛背后的魔力:没有对`＆std::option::Option 的实现== std::option::Option <_>
我是Python中Rust的新手。这是我学习Rust的第四天。在第一个问题Type casting for Option type之后，我有一个跟语法match和所有权概念有关的后续问题。首先，我
swift - 如何修复此闭包语法错误 : aka 'Optional<(Optional, Bool, Optional>, Optional) -> ()>'
我正在学习 Ray Wenderlich。我遇到了闭包语法错误。我想知道 Xcode 提示是什么意思？ Xcode 报告如下: /Users/.../FlickrPhotosViewControlle
python - 单击命令行界面 : Make options required if other optional option is unset
使用 Python 编写命令行界面 (CLI) 时 click library , 是否可以定义例如三个选项，其中仅当第一个(可选)未设置时才需要第二个和第三个选项？我的用例是一个登录系统，它允许我
java - Optional> 用于存储库层中的空列表返回 Optional.empty 。如何更改它以返回 Optional[[]]
我有一个这样的 JPA 查询。 PersonRepository.java public Optional> findByStatus(int status); 人员服务.java System.ou
scala - 有没有更惯用的方法从 Option[IO[Option[A]] 获取 IO[Option[A]] 然后使用序列和映射连接？
我遇到了很多地方，我有类似的东西 def f(s: String): Option[Long] = ... def g(l: Long): IO[Option[Wibble]] = ... val a
scala - 展平 Future[Option[Option[T]]] 的 Option 部分
我有一个results: List[Future[Option[T]]]其中包含(并行)计算。我想获得第一个非None尽快出结果，或者返回None如果所有计算都返回 None . 目前，我正在这样做
reactjs - typescript 错误 TS2322 : Type 'Option' is not assignable to type '(string & Option) | (number & Option) | (readonly string[] & Option)'
我正在尝试加载一个简单的 Listbox组件来自 @headlessui/react . 选择.tsx type Option = { id: number name: string
scala - `Future[Option[Future[Option[X]]]]` 变为 `Future[Option[X]]`
如何将Future[Option[Future[Option[X]]]]转换为Future[Option[X]]？如果它是 TraversableOnce 而不是 Option 我会使用 Futur
typescript - Option 或 Optional 类型 (Option) 在 TypeScript 中有意义吗？
Haskell、Rust 等语言提供了一个 Maybe 或 Option 类型。即使在 Java 中，也有一个 Optional 现在打字。为简单起见，我将在剩下的问题中将此类型称为“选项类型”。
sql-server - 如何避免在 SQL 中存储像？
当我尝试在 SQL 中存储一个 XML 而不是一个空元素时，SQL 只是更改它并仅使用一个元素标签来存储它。例如，要存储的 XML 是: ROGER 然后Sql存起来就好了
c++ - 使用 Argo 命令行解析器 : Unknown option is not returned when option is behind a exsiting option
使用这个非常好的命令行解析器 Argo(仅 header C++ 库)我遇到了一个小问题。请参阅:https://github.com/phforest/Argo Argo 返回:'Error: Un
scala - 与 Option.isEmpty 和 Option.get 相比，使用 Option.map 有什么优势？
我是来自 Java 背景的 Scala 新手，目前对考虑 Option[T] 的最佳实践感到困惑. 我觉得用 Option.map只是更实用和美观，但这不是说服其他人的好理由。有时， isEmpty
java - 如何以函数式风格多次写入 "if optional is empty, call next method returning optional, if not return this non-empty optional"？
这个问题在这里已经有了答案: Chaining Optionals in Java 8 (9 个回答) Optional orElse Optional in Java (6 个回答) Functio
java - 关于效率: .filter(Optional::isPresent).map(Optional::get) 不是比 .flatmap(Optional::stream) 更好吗？
Optional::stream如果存在，则返回一个包含该值的 Stream，否则返回一个空流。所以对于 Stream> optionals , optionals.flatMap(Optional:
c - 如何在 printf 菜单 ("==>") 上移动 printf 指示器 ("option 1\n option 2\n option 3")？
我使用箭头键作为输入，在 printf 菜单中上下移动 printf 箭头(“==>”)。我正在使用一个函数来计算箭头应该在的位置，并使用 switch case 和 printf("\n==>")
javascript - 非常简单的Javascript。这是什么 : "options = options || {};"?
这个问题在这里已经有了答案: What does the construct x = x || y mean? (12 个答案) 关闭 9 年前。如我的问题标题所述，我最近偶然发现了这个变量声明:
javascript - 'options || (options = {})' 是做什么的？
这个问题在这里已经有了答案: BackboneJS: What is options || (options = {}); in Backbone source code (1 个回答) 关闭 8
python - pyparsing Optional() & Optional() 允许重复
我有这个简单的语法: word = Word(alphanums + '_') with_stmt = Suppress('with') + OneOrMore(Group(word('key') +
css - 选择标签内的内容
使用 Cucumber 和 SitePrism 编写测试，我在页面上有以下 HTML... Select a Status Active Product Inactive Prod

首页

博学

6Ren·AI

商城

hadoop - hadoop mapreduce.partition.keypartitioner.options不起作用