jackrabbit - 在 Jackrabbit 存储库之间复制 Lucene 索引-6ren

jackrabbit - 在 Jackrabbit 存储库之间复制 Lucene 索引

转载作者：行者123 更新时间：2023-12-04 15:46:45

24

4

我有两个包含相同内容的 Jackrabbit 实例。重建 Lucene 索引很慢，30+ 小时，集群中需要的停机时间是有风险的。是否可以只重新索引一个 Jackrabbit，然后将 Lucene 索引从该实例复制到另一个实例？

天真地复制工作区目录下的 Lucene 索引文件是行不通的。问题似乎是内容按文档编号索引，文档编号映射到 UUID，该 UUID 映射到 inode 的 JCR 路径，但这些 UUID 对于 Jackrabbit 实例之间的给定路径不稳定。 (两者实际上都是由 CQ 作者实例的复制填充的 Day CQ 发布者实例。)

我已经设法在/jcr:system/jcr:versionStorage/下的存储库中找到了 UUID 到路径的映射，但是我看不到在存储库之间复制它以及 Lucene 索引的简单方法。然后我在文件中的任何地方都找不到 UUID-> 文档 ID 映射——这也是 Lucene 索引的一部分吗？

谢谢你的帮助。我倾向于单独重新索引第二个实例并接受停机时间，但任何降低风险或重新索引集群所用时间的想法都值得赞赏!

最后，我们将重新索引它们两者的路线:我们设法将测试实例重新用作额外的实时实例，我们可以暂时将其放入农场，同时我们将另外两个取出来重新-指数。但是，我仍然有兴趣听到更好的方法来做到这一点!

最佳答案

老实说，这似乎是一个可怕的想法。我不确定有什么方法可以保证您获得相同的基础数据，即使内容和硬件配置相同。

如果您的性能数据与我们的相似，则复制整个存储库的时间少于重新索引所需的时间。您是否考虑过重新索引一个存储库，进行备份/复制，然后将备份/复制配置为您的第二个实例？

关于jackrabbit - 在 Jackrabbit 存储库之间复制 Lucene 索引，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/11309154/

24

4

0

文章推荐： haskell - "No instance for (Ord k)"在 Data.Map.Map 上实现 Functor 时

文章推荐： meteor - 无法让公用文件夹在 meteor 0.3.7 中工作

jackrabbit - 将数据从一个 jackrabbit 存储库(Magnolia 存储库)传输/迁移到另一个 jackrabbit 存储库
任何人都知道如何将内容从一个 Magnolia CMS 存储库(Jackrabbit 存储库)传输/迁移到我们的应用程序使用的另一个自定义 jacrabbit 存储库？最佳答案正如另一张海报所建议
git - 直接写入远程 Git 存储库，而不将对象添加到本地索引/存储库？
Git 是否支持任何允许我直接从本地/工作树提交到远程存储库的命令？正常的工作流程至少需要一个“git add”来用文件内容的副本等填充对象数据库。我知道这不是正常的、预期的 Git 工作流程。但我
git - 防止从过时的 Git 存储库 pull/推并重定向到新的 Git 存储库
我们正在将 Git 存储库移动到新服务器。迁移后我们显然可以只删除旧的存储库，所以当人们尝试推送或 pull 时他们会得到一个错误并在 wiki 上查找新的存储库 URL，但是是否有可能阻止 pull
git - 将两个独立的 SVN 存储库 merge 为一个 Git 存储库
我们有两个 Subversion 存储库，每个存储库都有一个项目。所以: svn://server/svn/project_a svn://server/svn/project_b 它们是独立的项目，
eclipse - 合并/聚合 eclipse p2 存储库/可扩展的 p2 存储库
使用 maven/tycho 构建 Nodeclipse Eclipse 插件每个版本都有新的 p2 存储库。发布是在 Bintray 上完成的不允许更新文件。所以每个版本都在它的文件夹中。 Bas
mercurial - 如何将 mercurial 存储库(包括历史记录)作为子目录导入另一个 mercurial 存储库，而不使用子存储库？
这听起来有点复杂，让我解释一下: Project_A 在它自己的 Mercurial 存储库中已经存在了一段时间。 Project_A 现在被 merge 到一个新的 super 项目 Super-P
mercurial - 如何将一个 Mercurial 存储库(包括历史记录)作为子目录导入另一个 Mercurial 存储库，而不使用子存储库？
这听起来有点复杂，所以让我解释一下: Project_A 已在其自己的 Mercurial 存储库中存在了一段时间。 Project_A 现在正在 merge 到一个新的 super 项目 Super
git - 将 Git 存储库 A 移动到具有完整历史记录的 Git 存储库 B(非空)
我想将我的所有文件从 Git Repo A 移动到 Git Repo B 并具有完整的历史记录。 Git B 已经包含另一个项目文件。我尝试了几种方法，例如 How to move files fro
git - 如何 pull 一个原始的 git 存储库，其来源是 github 存储库？
我从 github 中托管的公共(public) git 存储库创建了一个裸存储库 (MY_LOCAL_REP): ~$ git clone --bare github 存储库已更新(创建了一个分支
git - 从 svn 存储库克隆 git 存储库，导致无文件、无远程分支的 git 存储库
工作 SVN 库我正在启动一个 git 存储库来与 svn 存储库进行交互。 svn 存储库已设置并且工作正常，其中包含一个基本 README 文件的单次提交。检查它工作正常: tchalvak:
spring-boot - spring boot 数据 redis 存储库 @Id 注释 vs jpa 存储库 @Id
我正在使用 spring boot 1.5.2 和 spring boot data redis 1.8。我有两个@Id 注解，一个用于JPA，另一个用于redis hash。这里我想使用 JPA
Maven 存储库
我是 maven 的新手。我仍然无法理解它的概念。例如，我正在寻找 com.extjs:gxt:jar:2.2.5 或 org.syslog4j:syslog4j:jar:0.9.46。我在任何 r
存储库、服务层和方法放置
我已经阅读了很多关于存储库模式和服务层的作用的书，我(我认为)很清楚这两者之间的区别。但是现在有一个简单的问题让我挠头了一段时间。我知道数据访问层如何负责...访问数据，因此典型的存储库可能具有插入
git - 如何导入旧设置/存储库
我是 Git/Smartgit 的新手。现在我不得不在 WIN 10 下配置一台新 PC。请问我如何将设置和存储库从旧 PC 导出/导入到新 PC？非常感谢，问候，本德最佳答案 SmartGit
其他存储库中的 Laravel 存储库
所以我最近开始在我的工作项目中使用存储库模式。我一直遇到同样的问题，我似乎无法找到答案: 可以将另一个存储库注入(inject)现有存储库吗？这样做有什么负面影响？例如 : class Crawls
Azure应用程序服务未将Gitlab容器注册表配置选择为私有(private)存储库
我有一个应用程序容器推送到 gitlab 容器注册表。我正在尝试将其作为容器部署到 azure web 应用程序服务中。我根据azure的文档尽我所能地进行了配置。但我不明白我错过了什么，因为 azu
java - 无法通过代理连接到互联网/存储库
我使用java框架来开发crud应用程序。这个框架被称为:“Cuba.Platform”。我的问题是，我无法在古巴打开该项目。当我尝试在那里打开我的项目时，我遇到了这个问题: “存储库包含 http
C# WCF 存储库
我在我的数据层中有几个对数据库执行 CRUD 操作的存储库类。我不确定这种设计，因为大多数表都需要每个存储库一个专用类，一段时间后我最终会为数据库中存在的每个表得到很多存储库。我这样做是因为，当然，我
C# 存储库 - 如何与其他存储库交互
我正在重构一些代码，并将一些执行数据库 CRUD 操作的方法提取到它们自己的存储库类中。我有几个问题，鉴于以下两种类型的对象存储在数据库中:用户和角色我应该创建 IUserRepository 和
c# - 存储库/服务层设计模式的建议
尝试在这里创建一个非常简单的存储库和服务层模式。 (.NET 4、C#、LINQ，尽管这个问题部分与语言无关)。注意:这只是研发。我的目标是尽量减少服务层中方法定义的数量。这是我的存储合约: in

首页

博学

6Ren·AI

商城

jackrabbit - 在 Jackrabbit 存储库之间复制 Lucene 索引