- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
任何人都可以向我解释一下,在以下情况下如何进行吗?
接收文档(MS 文档、ODS、PDF)
通过 Apache Tika 提取双重核心元数据 + 通过 jackrabbit-content-extractors 提取内容
使用 Jackrabbit 将文档(内容)与其元数据一起存储到存储库中 ?
检索文档 + 元数据
我对第 3 点和第 4 点感兴趣......
详情:该应用程序以交互方式处理文档(一些分析 - 语言检测,字数统计等+收集尽可能多的细节 - Dublin core + 解析内容/事件处理)以便将处理结果返回给用户,然后返回提取的内容和元数据(提取和自定义用户元数据)存储到 JCR 存储库中
感谢任何帮助,谢谢
最佳答案
上传文件对于 JCR 2.0 和 JCR 1.0 基本相同。但是,JCR 2.0 添加了一些有用的附加内置属性定义。
“nt:file”节点类型旨在表示一个文件,并且在 JCR 2.0 中有两个内置属性定义(这两个都是在创建节点时由存储库自动创建的):
并定义了一个名为“jcr:content”的子项。这个“jcr:content”节点可以是任何节点类型,但一般来说,与内容本身有关的所有信息都存储在这个子节点上。事实上的标准是使用“nt:resource”节点类型,它定义了这些属性:
请注意,“jcr:mimeType”和“jcr:encoding”是在 JCR 2.0 中添加的。
特别是,“jcr:mimeType”属性的目的是完全按照您的要求进行 - 捕获内容的“类型”。但是,“jcr:mimeType”和“jcr:encoding”属性定义可以(由 JCR 实现)定义为 protected (意味着 JCR 实现自动设置它们)——如果是这种情况,您将不允许手动设置这些属性。我相信Jackrabbit和 ModeShape不要将这些视为 protected 。
下面是一些代码,展示了如何使用这些内置节点类型将文件上传到 JCR 2.0 存储库:
// Get an input stream for the file ...
File file = ...
InputStream stream = new BufferedInputStream(new FileInputStream(file));
Node folder = session.getNode("/absolute/path/to/folder/node");
Node file = folder.addNode("Article.pdf","nt:file");
Node content = file.addNode("jcr:content","nt:resource");
Binary binary = session.getValueFactory().createBinary(stream);
content.setProperty("jcr:data",binary);
如果 JCR 实现不将“jcr:mimeType”属性视为 protected (即 Jackrabbit 和 ModeShape),您必须手动设置此属性:
content.setProperty("jcr:mimeType","application/pdf");
元数据可以很容易地存储在“nt:file”和“jcr:content”节点上,但开箱即用的“nt:file”和“nt:resource”节点类型不允许额外的属性。因此,在您可以添加其他属性之前,您首先需要添加一个 mixin(或多个 mixin),这些 mixin 具有您要存储的各种属性的属性定义。您甚至可以定义一个允许任何属性的混合。下面是一个 CND 文件,定义了这样一个 mixin:
<custom = 'http://example.com/mydomain'>
[custom:extensible] mixin
- * (undefined) multiple
- * (undefined)
注册此节点类型定义后,您可以在您的节点上使用它:
content.addMixin("custom:extensible");
content.setProperty("anyProp","some value");
content.setProperty("custom:otherProp","some other value");
您还可以定义和使用允许任何 Dublin Core element 的 mixin :
<dc = 'http://purl.org/dc/elements/1.1/'>
[dc:metadata] mixin
- dc:contributor (STRING)
- dc:coverage (STRING)
- dc:creator (STRING)
- dc:date (DATE)
- dc:description (STRING)
- dc:format (STRING)
- dc:identifier (STRING)
- dc:language (STRING)
- dc:publisher (STRING)
- dc:relation (STRING)
- dc:right (STRING)
- dc:source (STRING)
- dc:subject (STRING)
- dc:title (STRING)
- dc:type (STRING)
所有这些属性都是可选的,并且这个 mixin 不允许任何名称或类型的属性。我也没有真正解决这个 'dc:metadata' 混合问题,因为其中一些已经用内置属性表示(例如,“jcr:createBy”、“jcr:lastModifiedBy”、“jcr:created” , "jcr:lastModified", "jcr:mimeType"),其中一些可能与内容更相关,而另一些可能与文件更相关。
您当然可以定义其他更适合您的元数据需求的 mixin,并在需要时使用继承。但是要小心使用 mixin 的继承——因为 JCR 允许一个节点到多个 mixin,所以通常最好将 mixin 设计为严格限定范围和面向方面(例如,“ex:taggable”、“ex:describable”等)然后根据需要简单地将适当的混合应用到节点。
(甚至有可能定义一个 mixin,允许在“nt:file”节点下有更多子节点,并在那里存储一些元数据。)
Mixins 非常棒,可以为您的 JCR 内容提供极大的灵 active 和强大的功能。
哦,当你创建了所有你想要的节点后,一定要保存 session :
session.save();
关于java - 将元数据存储到 Jackrabbit 存储库中,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5155764/
任何人都知道如何将内容从一个 Magnolia CMS 存储库(Jackrabbit 存储库)传输/迁移到我们的应用程序使用的另一个自定义 jacrabbit 存储库? 最佳答案 正如另一张海报所建议
我们只使用 Jackrabbit 来存储文件,我们稍后会使用它们的完整路径或 UUID 来检索这些文件。在这种情况下关闭 Jackrabbit 索引是否安全? Jackrabbit XPath 查询呢
我有两个包含相同内容的 Jackrabbit 实例。重建 Lucene 索引很慢,30+ 小时,集群中需要的停机时间是有风险的。是否可以只重新索引一个 Jackrabbit,然后将 Lucene 索引
如果这听起来很愚蠢,我很抱歉,但是 Jackrabbit 和 Oak 之间有什么区别?我正在研究 JCR170,特别是如何在两个 jackrabbit 安装之间迁移内容,我遇到了 JackRabbit
在您的应用程序中将 Apache Jackrabbit JCR 作为嵌入式服务运行时,是否有一种快速的方法可以在不关闭 Jackrabbit 的情况下对 Jackrabbit 存储库的内容进行可靠且一
一旦节点被删除,您如何找到它以便您可以使用 jackrabbit 或 jcr API 恢复它? 最佳答案 我不是 Jackrabbit 版本控制方面的专家,但据我所知,除非您知道其中的一些数据,否则没
在我的项目中,我需要将 Jackrabbit 1.3 更改为 Jackrabbit 2.1.1。我的工作是为查询工作。如果索引格式和查询格式有变化,请建议我。 Jackrabbit 2.1.1 使用
如果我明白了,Apache Sling 会为 Jackrabbit JCR 存储库充当 REST CRUD 接口(interface)。 由于已经存在 RESTful 协议(protocol)(其 A
我已经使用 jackrabbit-standalone-2.4.2.jar 创建了一个代码,并且在项目目录中获取了 jackrabbit.log_IS_UNDEFINED.log 文件。该日志文件非常
我尝试使用 Jackrabbit 和 Oracle DB 作为持久层。因此,我在 Tomcat 6 服务器(本地)上安装了 Jackrabbit。数据库在虚拟机中运行。从 Jackrabbits 项目
我在 Jackrabbit 存储库中标记了对象(实际上是 Adobe/Day CQ 的 CRX,但我认为这是 Jackrabbit 代码): Assets :标签 = A、B 子 Assets 数
我有一个基于文件系统的Jackrabbit存储库,我想直接查看和编辑。是否有一个允许我直接查看/编辑/删除/添加节点的工具? 最佳答案 Jackrabbit本身目前没有内置的通用JCR资源管理器,但是
我正在将海量数据导入JackRabbit JCR存储库。一个好的可视化JCR存储库的UI管理工具将非常适合检查导入的数据是否布局正确,也将使我作为开发人员的生活更加轻松。 最佳答案 我是JCR Con
我想在集群中设置 Jackrabbit(我正在用 Liferay 设置它)。 我阅读了这份文件 - http://wiki.apache.org/jackrabbit/Clustering ,不幸的是
我遇到了一个问题,即由于一次有超过 1000 个访问控制条目处于事件状态,许多进程被阻塞;这是known issue in Jackrabbit ;已确定解决方法并将其推出到 2.4.1 中,但 CQ
我已经向 jackrabbit 用户列表发送了相同的消息,但没有人回复我。 我想使用 Jackrabbit 2.4.3 更新一个节点及其子节点,抛出 jackrabbit-jcr2dav。 (就像合并
在我们对使用 jackrabbit 的应用程序进行了一些性能测试之后,我们面临着并发修改 jackrabbit 存储库的巨大问题。当我们在多线程模拟中添加节点或编辑节点时,就会出现问题。然后我编写了非
我目前正在建立一个 Liferay 门户实例。 Liferay 使用 Jackrabbit 作为其文档存储库管理系统。要配置 Jackrabbit,我必须将数据库访问 URL、用户名和密码放入repo
有人可以提供一个集成 spring 3 和 jackrabbit 2.5 的例子吗?如果您可以在示例中提供 spring 配置 (applicationContext.xml) 和 jackrabbi
我的应用程序使用独立版本的 jackrabbit,我们想转移到嵌入式模式以便我们可以对其进行集群。 我阅读了 jackrabbit 集群站点上的要求,但仍然感到困惑。我应该为每个集群节点设置不同的主目
我是一名优秀的程序员,十分优秀!