gpt4 book ai didi

amazon-ec2 - 如何配置 Amazon EMR 流作业以使用 EC2 Spot 实例 (Ruby CLI)?

转载 作者:行者123 更新时间:2023-12-05 00:01:09 25 4
gpt4 key购买 nike

当我使用 Ruby 命令行界面使用 Amazon Elastic MapReduce (Amazon EMR) 创建流式作业时,如何指定仅使用 EC2 Spot 实例(主实例除外)?下面的命令正在运行,但它“强制”我至少使用 1 个核心实例...

./elastic-mapreduce --create --stream          \
--name n2_3 \
--input s3://mr/neuron/2 \
--output s3://mr-out/neuron/2 \
--mapper s3://mr/map.rb \
--reducer s3://mr/noop_reduce.rb \
--instance-group master --instance-type m1.small --instance-count 1 \
--instance-group core --instance-type m1.small --instance-count 1 \
--instance-group task --instance-type m1.small --instance-count 18 --bid-price 0.028

谢谢

最佳答案

CORE 和 TASKS 节点都运行 TaskTracker,但只有 CORE 节点运行 DataNode,所以,是的,您至少需要一个 CORE 节点。

所以你可以运行现货核心节点?

./elastic-mapreduce --create --stream \
...
--instance-group master --instance-type m1.small --instance-count 1 \
--instance-group core --instance-type m1.small --instance-count 19 --bid-price 0.028

附言您也可以运行一个 CORE 和多个 TASK 节点,但是,根据您正在执行的读/写量,您会感到痛苦,因为 18 个节点将读/写到 1 个节点。
# expect problems....
./elastic-mapreduce --create --stream \
...
--instance-group master --instance-type m1.small --instance-count 1 \
--instance-group core --instance-type m1.small --instance-count 1 --bid-price 0.028
--instance-group task --instance-type m1.small --instance-count 18 --bid-price 0.028

关于amazon-ec2 - 如何配置 Amazon EMR 流作业以使用 EC2 Spot 实例 (Ruby CLI)?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9291330/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com