作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我要实现的目标:
我已经设置了一个包含Hadoop任务的Spring Batch作业来处理一些较大的文件。
为了使多个Reducers运行,我需要使用setNumOfReduceTasks设置Reducers的数量。我正在尝试通过JobFactorybean进行设置。
我在类路径中的bean配置:/META-INF/spring/batch-common.xml:
<?xml version="1.0" encoding="UTF-8"?>
<beans xmlns="http://www.springframework.org/schema/beans"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xmlns:p="http://www.springframework.org/schema/p"
xsi:schemaLocation="http://www.springframework.org/schema/beans http://www.springframework.org/schema/beans/spring-beans.xsd">
<bean id="jobFactoryBean" class="org.springframework.data.hadoop.mapreduce.JobFactoryBean" p:numberReducers="5"/>
<bean id="jobRepository" class="org.springframework.batch.core.repository.support.MapJobRepositoryFactoryBean" />
<bean id="transactionManager" class="org.springframework.batch.support.transaction.ResourcelessTransactionManager"/>
<bean id="jobLauncher" class="org.springframework.batch.core.launch.support.SimpleJobLauncher" p:jobRepository-ref="jobRepository" />
</beans>
<?xml version="1.0" encoding="UTF-8"?>
<beans xmlns="http://www.springframework.org/schema/beans"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xmlns:context="http://www.springframework.org/schema/context"
xsi:schemaLocation="
http://www.springframework.org/schema/beans http://www.springframework.org/schema/beans/spring-beans-3.0.xsd
http://www.springframework.org/schema/context http://www.springframework.org/schema/context/spring-context-3.0.xsd">
<context:property-placeholder location="classpath:batch.properties,classpath:hadoop.properties"
ignore-resource-not-found="true" ignore-unresolvable="true" />
<import resource="classpath:/META-INF/spring/batch-common.xml" />
<import resource="classpath:/META-INF/spring/hadoop-context.xml" />
<import resource="classpath:/META-INF/spring/sort-context.xml" />
</beans>
JobLauncher launcher = ctx.getBean(JobLauncher.class);
Map<String, Job> jobs = ctx.getBeansOfType(Job.class);
JobFactoryBean jfb = ctx.getBean(JobFactoryBean.class);
No bean named '&jobFactoryBean' is defined
JobFactoryBean jfb = ctx.getBean(JobFactoryBean.class);
ctx.getBean("jobFactoryBean");
<job id="search-jobSherlockOk" input-path="${sherlock.input.path}"
output-path="${sherlockOK.output.path}"
mapper="com.romediusweiss.hadoopSort.mapReduce.SortMapperWords"
reducer="com.romediusweiss.hadoopSort.mapReduce.SortBlockReducer"
partitioner="com.romediusweiss.hadoopSort.mapReduce.SortPartitioner"
number-reducers="2"
validate-paths="false" />
<property>
<name>mapred.tasktracker.reduce.tasks.maximum</name>
<value>10</value>
</property>
最佳答案
在还发布了该问题的Spring论坛上回答了该问题(建议将其用于Spring Data Hadoop问题)。
完整的答案是http://forum.springsource.org/showthread.php?130500-Additional-Reducers,但简而言之, reducer 的数量由输入拆分的数量驱动。参见http://wiki.apache.org/hadoop/HowManyMapsAndReduces
关于spring - 在单个Hadoop节点上连接Hadoop Jobfactorybean,多个Reducer,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12490889/
我要实现的目标: 我已经设置了一个包含Hadoop任务的Spring Batch作业来处理一些较大的文件。 为了使多个Reducers运行,我需要使用setNumOfReduceTasks设置Redu
我是一名优秀的程序员,十分优秀!