hadoop - 设置所需号码的映射器-6ren

hadoop - 设置所需号码的映射器

转载作者：可可西里更新时间：2023-11-01 16:14:27

27

4

我浏览了很多关于 stackoverflow 和 apache wiki 的博客，以了解映射器在 Hadoop 中的设置方式。我还经历了 [ hadoop - how total mappers are determined [这个帖子。有人说它基于 InputFormat，而一些帖子说它基于输入文件 ID 分成的 block 数。

一些我对默认设置感到困惑的地方。

当我运行一个 wordcount 示例时，我看到映射器低至 2。设置中到底发生了什么？还有这篇文章 [ http://svn.apache.org/repos/asf/hadoop/common/trunk/hadoop-mapreduce-project/hadoop-mapreduce-examples/src/main/java/org/apache/hadoop/examples/QuasiMonteCarlo.java] [示例程序]。在这里，他们根据用户输入设置映射器。如何手动进行此设置？

如果能提供一些帮助和了解映射器的工作原理，我将不胜感激。

提前致谢

最佳答案

使用 java 系统属性 mapred.min.split.size 和 mapred.max.split.size 来引导 Hadoop 使用您想要的拆分大小。这并不总是有效 - 特别是当您的数据采用不可拆分的压缩格式时(例如 gz，但 bzip2 是可拆分的)。

因此，如果您想要更多映射器，请使用较小的拆分大小。很简单!

(根据要求更新)现在这对很多小文件都不起作用，特别是你最终会得到比你想要的更多的映射器。对于这种情况，请使用 CombineFileInputFormat ... 在 Scalding 这个 SO 解释:Create Scalding Source like TextLine that combines multiple files into single mappers

关于hadoop - 设置所需号码的映射器，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/24783556/

27

4

0

文章推荐： c++ - C++ 中数字类型转换的最佳实践

文章推荐： logging - cdh4 hadoop 中作业的详细日志在哪里？

文章推荐： java - MapReduce ArrayList 类型不匹配

android - 通过手机浏览器检索 IMEI 号码/SIM 号码/手机号码
以下是场景:我有一个可通过移动浏览器访问的网络应用程序。每当用户单击通过网络浏览器访问的应用程序页面中的链接时，我需要检测移动设备 IMEI 和 sim IMSI。这是为了跟踪具有相同 SIM 卡的同
android - 通过手机浏览器检索 IMEI 号码/sim 号码/手机号码
场景如下:我有一个可通过移动浏览器访问的 Web 应用程序。每当用户单击可通过网络浏览器访问的我的应用程序页面中的链接时，我都需要检测移动设备的 IMEI 和 sim IMSI。这是为了跟踪具有相同
android - 如何在 PhoneGap 移动应用程序中获取 IMEI 号码、SIM 号码、手机号码？
我需要在 Phonegap 为 Android 构建 HTML 移动 Web 应用程序中获取 IMEI 号码、手机号码、SIM 号码最佳答案你不能直接得到它们。选项 1) 寻找一些插件，我不确定
javascript - 在javascript中验证姓名/号码
我有一个输入框。它可能包含名称或数字。如果输入至少有一个字母，我们将其作为名称处理，并且其长度应为 11 或更短。因此有效输入可能是 Bob、12Bob 或 Bob23。不允许有空格或其他字符，因此
MySql 如何将一个表中的电话字段分成两个单独表中的前缀/号码？
我有这个要求:从客户表中 - 返回电话号码的前缀。我尝试使用字符串，将全名拆分为名字/姓氏，但它仅适用于数字。完整的nb格式为(258)1231456 最佳答案 SELECT '(258) 12314
algorithm - 如何生成验证码/号码？
我正在开发一个应用程序，用户必须使用手机键盘调用电话并输入验证号码。我希望能够检测他们输入的数字是否正确。电话系统无法访问有效号码列表，但它会根据算法(如信用卡号码)验证号码。以下是一些要求: 一
nfc - 如何找到我本地交通卡的 AID 号码？
我有一张城市交通卡。我需要知道卡的援助(应用程序标识符)号码是多少。根据 EMV Book 1，我必须使用 List of AIDs 方法(第 141 页)。但是如何呢？我还有一个 ACR122U
javascript 分解 VIN 号码
我想使用 javascript 分解数组中的 VIN，可能使用正则表达式，然后使用某种循环... 以下是读取 VIN 的方法: http://forum.cardekho.com/topic/600-
telegram - 预先填写的消息发送至 Telegram 号码
Here我找到了一个非常有用的答案，展示了如何使用 Whatsapp 从网站发送预填充的消息。我们可以对 Telegram 做同样的事情吗？最佳答案您可以尝试使用以下方式打开 Telegram
ios - 如何在收到推送通知时更新角标(Badge)号码
我需要帮助完成这段代码，以便应用程序在收到推送通知时显示角标(Badge)编号，我可以收到推送通知，但应用程序上没有角标(Badge)，这是代码 func application(_ applica
Twilio:调用分机号码和 twilio 号码
我正在使用 Twilio 进行入站调用，用户可以通过 Twilio-Number(从 Twilio 获得)调用应用程序并将被重定向到管理员。现在，我们希望管理员使用相同的 Twilio 号码调用用户
c# - 正则表达式:解析街道名称/号码
C#/.NET 2.0 我需要解析一个字符串，其中包含街道名称和房屋编号的两个独立值。 in: "Streetname 1a" out: "streetname" "1a"
java - 从联系人姓名而不是数字解析 URI 号码
正如你们可能建议的那样，我正在创建一个带有语音命令的 SIRI。现在我确实想添加一个调用功能。例如我有这段代码: Intent call = new Intent(Intent.ACTION_DIAL
android - 使用后台服务发送短信并通过短信发送 IMEI 号码
我想构建一个 android 应用程序，当设备第一次启动时，它会检测 IMEI 和其他设备信息，并检查是否有 SIM 卡。如果有 SIM 卡，它会发送短信包含特定号码的 IMEI 和其他设备信息。我
javascript - 如何更改 key 号码？
我有这个对象: a = {"formData": { "total": "60.00", "tr0_RTN": "PZH", "tr0_amount": "10.00",
android - 是否可以在安卓手机中更改 imei 号码
我正在制作一个测试工具，我有 imei 号码，但是否可以简单地或通过 NDK 更改 imei 号码。谢谢最佳答案如何更改 IMEI 取决于硬件/系统，并且它是 - 至少在世界的(大部分)部分 -
php - 如何选择家长的 child 号码？
我有一个表，其中有子项和父项，父项的 pid 为 0，子项的 pid 为父项的 id。我想选择父级及其子级数。我的模型: function parent_child() {
ios - 如何更新通知角标(Badge)号码？
抱歉，因为我从 android 开发跳到 IOS 开发，我想知道收到通知时是否有任何函数会触发？或者我应该如何处理通知？这是我应用中的应用委托(delegate)。问题是每当收到消息时，如果应用程序
android - 如何检测私有(private)号码
我正在开发应用程序，当它收到未接来电或来自手机的消息时自动发送消息。我的问题是当我从私有(private)号码收到未接来电或从私有(private)号码或服务器收到消息时(way2sms，160/2，
ios - 检查联系人的号码是移动电话还是固定电话(固定电话)号码
我想检查从联系人那里得到的电话号码是手机号码还是固定电话号码。我试过使用正则表达式，但一切都是徒劳的..任何帮助都将非常感激最佳答案要按手机号码和固定电话过滤联系人，您需要在数据库中有标准代码列表

首页

博学

6Ren·AI

商城

hadoop - 设置所需号码的映射器