gpt4 book ai didi

objective-c - 在 PDF : Tm or Td/TD? 中查找文本

转载 作者:搜寻专家 更新时间:2023-10-30 20:20:59 25 4
gpt4 key购买 nike

我知道这个问题之前已经被问过几次了,但我只想澄清一下。我有一个pdf阅读器,我想给它添加一个高亮功能。我已经可以通过解析 TjTJ 运算符来提取文本。现在我想在pdf中找到文本的位置。

起初我试图找到 Tm 值。我能够提取 Tm 的 (x,y),但它似乎不正确。所以我决定选择 TdTD。问题是 pdf 似乎不包含任何 TdTD 值,因为从未调用过运算符回调。 (我在回调中放了一个日志,只是为了看看它是否被调用,但它从未出现过。)

所以我的问题是,如果我想找到文本在 pdf 中的位置,我应该查看哪个? Tm 值还是 Td/TD 值?还是两者兼而有之?

附加问题:

Tm 有六个参数:a, b, c, d, ef。我知道ef代表txty,但是其他四个参数代表什么?

最佳答案

您需要处理所有 文本运算符,您还需要了解其中一些运算符的工作原理。例如,垂直书写字体将应用 W2 条目以在绘制字形之前将水平字形原点移动到垂直字形原点。

除了 Tm、TD 和 Td 之外,您还需要处理 T*,除了 TJ 和 Tj 之外,您还需要处理 ' 和 "如果您想知道文本在单个“显示”操作中的定位方式,那么您还需要考虑Tc、Tw、Tz、TL和Ts的取值。

您可能还需要处理当前转换矩阵。

关于objective-c - 在 PDF : Tm or Td/TD? 中查找文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11188914/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com