gpt4 book ai didi

hadoop - UIMA DUCC 与 Hadoop 上的 UIMA

转载 作者:可可西里 更新时间:2023-11-01 16:22:51 25 4
gpt4 key购买 nike

我正在尝试设计一个基于 UIMA 的分布式可扩展管道。我应该如何决定在 Hadoop 上使用 UIMA DUCC 还是 UIMA?如果我在 UIMA DUCC 而不是 Hadoop 上构建它,反之亦然,我会错过什么?

最佳答案

一个维度是应用程序特性。 Hadoop 对于 I/O 密集型应用程序将具有很大的优势。对于需要在不同线程中运行多个管道副本以实现高 CPU 利用率的大内存应用程序,DUCC 应该具有很大的优势。

另一个方面是利用 UIMA 与利用 Hadoop。 DUCC 建立在基本 UIMA 功能之上,提供许多横向扩展选项、内置性能指标和调试支持,所有这些都基于核心 UIMA 组件。 UIMA 流水线越复杂,DUCC 的优势就越大;例如,复杂的处理流程可以直接在 DUCC 中实现,但可能必须转换为 map-reduce。

对于那些拥有足够 Hadoop 专业知识的人来说,一个相对简单的 UIMA 分析可以很容易地集成到现有的 Hadoop 商店中,而无需学习很多关于 UIMA 的知识。

关于hadoop - UIMA DUCC 与 Hadoop 上的 UIMA,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29873686/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com