作者热门文章
- android - RelativeLayout 背景可绘制重叠内容
- android - 如何链接 cpufeatures lib 以获取 native android 库?
- java - OnItemClickListener 不起作用,但 OnLongItemClickListener 在自定义 ListView 中起作用
- java - Android 文件转字符串
我有几个异构输入需要用不同的映射器处理,以生成一个同质映射,之后可以通过单个缩减器的多个实例进行缩减。与连接所有映射器的输出并将它们提供给只会发出与接收到的结果相同的结果的 id-mapper 相比,它是否可以以更优雅的方式完成?我正在使用 Python Hadoop Streaming API,因此它比使用 MultipleInputs Java 接口(interface)要复杂一些。
最佳答案
您正在寻找的是 MultipleInputs 。您应该为不同的异构输入编写不同的映射器。
在您的驱动程序中,您应该将不同的路径映射到它们各自的映射器。
所有这些 mapper 都应该将它们各自的 map 输出转换为将由 reducer 使用的标准输出。
http://bytepadding.com/big-data/map-reduce/multipleinputs-in-map-reduce
关于python - 如何从多个仅映射任务创建单个分布式内存映射?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27523347/
我是一名优秀的程序员,十分优秀!