gpt4 book ai didi

java - mapreduce 作业中的 API 调用

转载 作者:可可西里 更新时间:2023-11-01 16:34:37 26 4
gpt4 key购买 nike

我想问一下在运行 map reduce 作业时调用外部 API 的不便之处。有哪些缺点?

一些示例:如果在映射器内部我们需要对地址进行地理编码并调用 google maps api,或者调用外部数据库以获取项目的相关元素等。

最佳答案

只要外部 API 中没有数据库调用,就可以调用外部 API。在许多方面,这比重新编写您的逻辑更可取。通常,您希望 MapReduce 作业只不过是在非 MapReduce 上下文中编写的包装器逻辑。这有助于获得更好的可测试代码。

但是,强烈建议不要进行外部数据库调用。这将大大降低 MapReduce 作业的速度,因为每次调用都是随机访问调用。此外,同时有数千个 Map/Reduce 任务访问您的数据库可能会使数据库崩溃。如果您需要相关元素,最好将所有元素都放在 HDFS 上并在 MapReduce 中进行连接。如果您谈论的数据库是 NoSQL 存储,例如 Cassandra 或 HBase,它们将具有批量导出功能,可以将整个表导出到 HDFS。

关于java - mapreduce 作业中的 API 调用,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9565200/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com