- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有许多 TIFF 文件,其中包含描述和“关键字”(正如 OS X 在文件检查器中对它们的称呼)。但是,我很难从图像中收集这些元数据。
我试过使用 tifffile.py , PIL的 exif 命令和 IPTCInfo ,虽然 tifffile.py 将得到描述,但我似乎仍然无法使用这些库中的任何一个从文件中解析“关键字”。
TIFF 和 JPEG 是否使用不同的“规范”存储关键字?解析这些关键字的最佳方法是什么?
编辑
根据 abarnert
的评论,我在文本编辑器中打开了一个 TIFF 文件,发现 包含“关键字”的 XML 数据。以下片段:
...
<rdf:Description rdf:about=""
xmlns:dc="http://purl.org/dc/elements/1.1/">
<dc:description>
<rdf:Alt>
<rdf:li xml:lang="x-default">OLYMPUS DIGITAL CAMERA</rdf:li>
</rdf:Alt>
</dc:description>
<dc:format>image/tiff</dc:format>
<dc:subject>
<rdf:Bag>
<rdf:li>Foo</rdf:li>
<rdf:li>Bar</rdf:li>
<rdf:li>A long keyword</rdf:li>
</rdf:Bag>
</dc:subject>
</rdf:Description>
...
看起来这可以存储为二进制表示; tifffile.py 列出了一些本质上是整数元组的标签。但是,我不确定如何转换它。有什么建议吗?
最佳答案
Are keywords stored using a different "specification" for TIFFs than for JPEGs?
好吧,这取决于。
TIFF 容器只有一组非常有限的元数据标签,并且无法指定任意关键字。
JPEG 根本不是一种容器类型;它是一种图像压缩编解码器,可用于各种不同的容器,包括 TIFF。但通常当您说“JPEG 文件”时,您指的是 JFIF,它是 JPEG 组指定的一种容器格式,并且与 TIFF 一样,JFIF 的元数据标签集非常有限。
Exif 是另一种容器格式,就结构而言与 TIFF 相同,但它定义了新标签,明确用于元数据,这意味着您可以简单地将 TIFF 包装为 Exif,它仍然是合法的 TIFF,并且有一点偷偷摸摸你也可以用一种不太合法的 JFIF 的方式将 JFIF 包装为 Exif,但几乎所有软件都接受它。
Exif 是向 JFIF 添加元数据的唯一常用方法(不包括 DCF,它与 Exif 基本相同),但它是向 TIFF 添加元数据的多种不同方法之一。 IPTC 是另一个,XMP、OME 可能还有很多其他的。
因此,一些 TIFF 文件使用与 JFIF-wrapped-in-Exif 相同的规范存储“关键字”,但其他文件则不然。
What would be the best approach to parse these keywords?
那么,您需要知道它们的存储格式。
不用说,PIL 的 exif 命令只支持 Exif,IPTCInfo 只支持 IPTC,而 tifffile 主要支持……好吧,各种不同的东西。
我相信 tifffile.py 可以存储未知标签类型是原始二进制数据,您可以遍历这些数据并查看您遗漏了什么。这将至少涵盖所有使用 TIFF 容器结构的扩展。如果您在那里找不到关键字,那么……至少可以排除许多常见格式。
无论如何,一旦您知道要寻找哪种格式,就可以寻找可以处理它的库。 (或者,如果它是基于 XML 的标签之一,只需使用 tifffile 将标签读取为二进制数据,然后将其解析为 UTF-8 XML,这可能比查找不同的库更容易。)
关于python - 从 Tiff 图像中获取描述/关键字?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11314894/
我需要您在以下方面提供帮助。近一个月来,我一直在阅读有关任务和异步的内容。 我想尝试在一个简单的 wep api 项目中实现我新获得的知识。我有以下方法,并且它们都按预期工作: public Htt
我的可执行 jar 中有一个模板文件 (.xls)。不需要在运行时我需要为这个文件创建 100 多个副本(稍后将唯一地附加)。用于获取 jar 文件中的资源 (template.xls)。我正在使用
我在查看网站的模型代码时对原型(prototype)有疑问。我知道这对 Javascript 中的继承很有用。 在这个例子中... define([], function () { "use
影响我性能的前三项操作是: 获取滚动条 获取偏移高度 Ext.getStyle 为了解释我的应用程序中发生了什么:我有一个网格,其中有一列在每个单元格中呈现网格。当我几乎对网格的内容做任何事情时,它运
我正在使用以下函数来获取 URL 参数。 function gup(name, url) { name = name.replace(/[\[]/, '\\\[').replace(/[\]]/,
我最近一直在使用 sysctl 来做很多事情,现在我使用 HW_MACHINE_ARCH 变量。我正在使用以下代码。请注意,当我尝试获取其他变量 HW_MACHINE 时,此代码可以完美运行。我还认为
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 关闭 9 年前。 要求提供代码的问题必须表现出对所解决问题的最低限度的理解。包括尝试过的解决方案、为什么
由于使用 main-bower-files 作为使用 Gulp 的编译任务的一部分,我无法使用 node_modules 中的 webpack 来require 模块code> dir 因为我会弄乱当
关闭。这个问题需要更多focused .它目前不接受答案。 想改进这个问题吗? 更新问题,使其只关注一个问题 editing this post . 关闭 5 年前。 Improve this qu
我使用 Gridlayout 在一行中放置 4 个元素。首先,我有一个 JPanel,一切正常。对于行数变大并且我必须能够向下滚动的情况,我对其进行了一些更改。现在我的 JPanel 上添加了一个 J
由于以下原因,我想将 VolumeId 的值保存在变量中: #!/usr/bin/env python import boto3 import json import argparse import
我正在将 MSAL 版本 1.x 更新为 MSAL-browser 的 Angular 。所以我正在尝试从版本 1.x 迁移到 2.X.I 能够成功替换代码并且工作正常。但是我遇到了 acquireT
我知道有很多关于此的问题,例如 Getting daily averages with pandas和 How get monthly mean in pandas using groupby但我遇到
This is the query string that I am receiving in URL. Output url: /demo/analysis/test?startDate=Sat+
我正在尝试使用 javascript 中的以下代码访问 Geoserver 层 var gkvrtWmsSource =new ol.source.ImageWMS({ u
API 需要一个包含授权代码的 header 。这就是我到目前为止所拥有的: var fullUrl = 'https://api.ecobee.com/1/thermostat?json=\{"s
如何获取文件中的最后一个字符,如果是某个字符,则删除它而不将整个文件加载到内存中? 这就是我目前所拥有的。 using (var fileStream = new FileStream("file.t
我是这个社区的新手,想出了我的第一个问题。 我正在使用 JSP,我成功地创建了 JSP-Sites,它正在使用jsp:setParameter 和 jsp:getParameter 具有单个字符串。
在回答 StoreStore reordering happens when compiling C++ for x86 @Peter Cordes 写过 For Acquire/Release se
我有一个函数,我们将其命名为 X1,它返回变量 Y。该函数在操作 .on("focusout", X1) 中使用。如何获取变量Y?执行.on后X1的结果? 最佳答案 您可以更改 Y 的范围以使其位于函
我是一名优秀的程序员,十分优秀!