gpt4 book ai didi

python - 如何在Windows 10的cmd外壳上的笔记本电脑上本地运行mapreduce程序

转载 作者:行者123 更新时间:2023-12-02 20:22:10 25 4
gpt4 key购买 nike

我正在尝试在笔记本电脑安装的hadoop 2.8版本上本地运行MapReduce程序。我很困惑如何在Cmd Shell中使用以下命令。

这是我的命令,还共享映射器和化简器代码。和我的数据在CSV文件中。

D:\hadoop\bin\hadoop jar D:\hadoop\share\hadoop\tools\lib\hadoop-streaming-2.3.0.jar 
-D mapred.reduce.tasks=0
-file /reducer.py -mapper "mapper.py"
-input /data2.csv -input /data2.csv
-output /output
#!/usr/bin/python3
#mapper.py
import sys

# input comes from STDIN (standard input)
for line in sys.stdin:
line = line.strip()
line = line.split(",")

if len(line) >=2:
sex = line[1]
age = line[2]
print ('%s\t%s' % (sex, age))
#!/usr/bin/python3
#Reducer.py
import sys

sex_age = {}

#Partitoner
for line in sys.stdin:
line = line.strip()
sex, age = line.split('\t')

if sex in sex_age:
sex_age[sex].append(int(age))
else:
sex_age[sex] = []
sex_age[sex].append(int(age))

#Reducer
for sex in sex_age.keys():
ave_age = sum(sex_age[sex])*1.0 / len(sex_age[sex])
print ('%s\t%s'% (sex, ave_age))

最佳答案

该命令在任何Hadoop环境中均应相同。

FWIW,您可能应该至少使用Pyspark

关于python - 如何在Windows 10的cmd外壳上的笔记本电脑上本地运行mapreduce程序,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59750303/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com