gpt4 book ai didi

java - 通过 Oracle Search 和 Export 提取多个嵌入文件

转载 作者:太空宇宙 更新时间:2023-11-04 07:40:06 30 4
gpt4 key购买 nike

我目前正在使用 Java 实现 Oracle OutsideIn 搜索和导出工具来提取不同文件的元数据和内容。我能够对文件夹内的多个文件执行此操作,但无法提取嵌入在另一个文件中的文件。我想知道这是否可以在搜索和导出中实现。

如果没有,我会选择 CleanContent,但它只接受 Microsoft 和 PDF 文件。

最佳答案

搜索导出可以从存档或其他类型的文件中转换或提取嵌入文件。我们区分三种不同类型的嵌入,每种类型都有自己的选项来控制其转换。这三种类型是存档子文档、电子邮件附件和通用嵌入。默认情况下,前两个会被转换,但第三个不会。要启用通用嵌入转换,请在 SCCOPT_XML_SEARCHML_FLAGS 选项中设置 SCCEX_XML_EMBEDDINGS 标志。如果您使用的是 SDK 附带的导出器示例应用,请尝试在 CFG 文件中启用以下功能。

嵌入标志是

如果您尝试提取嵌入的二进制副本,则它会变成一个三步过程。在初始转换时,在 SCCOPT_XML_SEARCHML_FLAGS 选项中设置 SCCEX_XML_PRODUCEOBJECTINFO 标志。使用所需嵌入的信息来填充传递给 DAOpenDocument 的 SCDAOBJECT 结构。从该函数返回的 hDoc 可以传递给 DASaveInputObject 以保存嵌入的二进制副本。这适用于上述三种嵌入类型中的任何一种。没有 Java 示例应用程序可以演示此过程。

关于java - 通过 Oracle Search 和 Export 提取多个嵌入文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16202683/

30 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com