gpt4 book ai didi

java - Apache TIKA - 添加新的元数据值

转载 作者:太空宇宙 更新时间:2023-11-04 13:37:47 24 4
gpt4 key购买 nike

我正在使用 Apache TIKA 将新的元数据值添加到 .doc 文件。

File file=new File(filepath);
Parser parser = new AutoDetectParser();
BodyContentHandler handler = new BodyContentHandler();
Metadata metadata = new Metadata();
FileInputStream inputstream=new FileInputStream(file);
ParseContext context =new ParseContext();
parser.parse(inputstream, handler, metadata, context);
metadata.add("Author","My Author");

如果我列出文档的所有元数据值:

String[] metadataNamesafter = metadata.names();
for(String name : metadataNamesafter) {
System.out.println(name + ": " + metadata.get(name));
}

作者已更改,但此属性未保存在物理文件中。有人可以告诉我该怎么做吗?

谢谢大家。

最佳答案

目前,Apache Tika 不支持此功能。目前(2015 年 7 月),Apache Tika 仅提供从文件中提取元数据和文本内容的方法。因此,无法将更改保存到文件中。

这是 Apache Tika 社区中讨论过的问题,并且已经使用外部程序针对图像文件创建了一个嵌入式概念验证。您可以找到interface hereimplementation javadocs here 。在某些时候,大多数主要格式可能都会支持将更改后的元数据嵌入回格式中,但这在今天是不可能的。目前,社区的重点主要是提取,而不是储蓄。

关于java - Apache TIKA - 添加新的元数据值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31538332/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com