gpt4 book ai didi

marklogic - 在 Marklogic 中启用 CPF

转载 作者:行者123 更新时间:2023-12-02 05:18:37 24 4
gpt4 key购买 nike

我想了解在 Marklogic 4.2.9 服务器上启用 CPF - 内容处理框架的影响。我们有一个 3TB 大小的生产数据库,我们正在研究需要执行多项操作的各种内容丰富和内容删除任务。我在以前的项目中致力于创建 CFP 管道,但在我当前的项目中,数据库当前禁用了 CPF。我想了解的是,何时/如果我们在此数据库上启用 CPF,会对什么产生影响1.Marklogic内存使用2.磁盘空间3.整体表现4.IO等我们尝试创建的管道将影响数据库中存在的所有/任何文档。

感谢帮助!!!

最佳答案

我认为@mblakele 很好地涵盖了对内存和磁盘的影响。但我想就公积金的运作方式多说几句。这可能有助于了解性能通常如何受 CPF 影响。

CPF依赖于MarkLogic的触发机制。任何文档插入、更新和删除都会激活带有初始状态转换的 CPF 处理。每个操作都会导致额外的状态转换。每个状态转换都涉及提交后触发器的执行,调用一些执行实际操作模块的 xdmp:invoke 的 CPF 内部代码。因此,如果您有一个插入 100 个文档的事务,这会导致 100 个提交后任务在任务服务器队列中排队等待启动。而且我担心 xdmp:invokes 会导致另外 100 个任务排队。如果文档平均经过三种状态,则该数字至少乘以三。

换句话说,CPF对任务服务器队列影响很大。实际影响性能的程度可能取决于您已经使用任务服务器的程度。任务服务器上的任何非 CPF 任务都将被 CPF 任务延迟。另一方面,如果您目前没有真正使用任务服务器,您可能不会注意到这一点。应用服务器请求在单独处理的应用服务器队列上运行。

另一件事是 CPF 单独处理文档。这是缓慢而有弹性的后台处理的理想选择。但是,如果您需要速度,则最好为成批文档创建交易。

喂!

关于marklogic - 在 Marklogic 中启用 CPF,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14242092/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com