gpt4 book ai didi

pdf - FEFF0009 的/ActualText 在 PDF 中是什么意思?

转载 作者:行者123 更新时间:2023-12-04 23:33:33 26 4
gpt4 key购买 nike

我一直在查看一个 PDF 文件以了解它是如何构建的。

我注意到 InDesign 创建了带有如下文本的 PDF(使用 pdftk 解压缩后)。

0 Tc /Span<</ActualText<FEFF0009>>> BDC 
4.018 -0.2 Td
( )Tj

我了解 ActualText(用于复制/粘贴/搜索)的作用,但我想知道我应该如何解释 FEFF0009。它看起来像一个带有 BOM 字符的 UTF-16 字符串来表示一个制表符。这似乎不正确,因为它确实是一个空间。我想知道这里是否有特殊含义?

最佳答案

.. This seems incorrect as it's really a space.



不,它真的是一个标签。

14.9.4 Replacement Text
NOTE 1: Just as alternate descriptions can be provided for images and other items that do not translate naturally into text (as described in the preceding sub-clause), replacement text can be specified for content that does translate into text but that is represented in a nonstandard way.
(PDF 32000-1:2008)



PDF 文本引擎不支持“标签”的概念。在这种情况下,InDesign 通过在文本流中插入空格来模仿制表符的功能,它可以设置空格宽度以匹配原始制表符所跨越的距离,或者对其余文本使用较大的相对定位(它在这里做了:在你的代码片段中 4.018 的水平位移)。

一般的想法是在选项卡的位置呈现一个空格,但是当您复制此文本并粘贴到其他地方时,您会得到一个制表符。我想插入“空间”只是为了复制一些东西。

关于pdf - FEFF0009 的/ActualText 在 PDF 中是什么意思?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26374320/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com