gpt4 book ai didi

ruby-on-rails-3 - 当我使用模板时,我的文字方向写错了

转载 作者:行者123 更新时间:2023-12-03 00:32:06 24 4
gpt4 key购买 nike

我想使用 Rails 在现有 PDF 上添加文本,所以我这样做了:

filename = "#{Rails.root}/app/assets/images/sample.pdf"
Prawn::Document.generate("#{Rails.root}/app/assets/images/full_template.pdf", :template => filename) do
text "Test", :align => :center
end

当我打开 full_template.pdf 时,我有我的模板 PDF + 我的文本“测试”,但该文本的书写方向不好,就好像我的文本是使用镜子书写的一样。

您可以在此处找到这两个 PDF 文档:

原文:http://www.sebfie.com/wp-content/uploads/sample.pdf

生成:http://www.sebfie.com/wp-content/uploads/full_template.pdf

最佳答案

让我们看看...[切换到 PDF Debug模式]

首先,我在 qpdf 的帮助下解压您的 full_template.pdf ,一个命令行实用程序“对 PDF 文件进行结构性、内容保留的转换”( self 描述):

qpdf --qdf full_template.pdf qdf---test.pdf

结果,qdf---test.pdf 现在在普通文本编辑器中更容易分析,因为所有流都已解压。

搜索字符串“est”会找到这一行:

[(T) 120 (est)] TJ

再仔细研究一下(看看 qpdf 的非常有用的注释散布在其输出中!)我们发现:原始 PDF 中出现镜像字符串“Test”的 PDF 对象的编号是 22。是与文件文本的其余部分完全独立的对象,并且它也是唯一使用未嵌入的 Helvetica 字体的对象。

因此,让我们将其与原始文件分开提取:

qpdf --show-object=22 --filtered-stream-data full_template.pdf 

q
/DeviceRGB cs
0.000 0.000 0.000 scn
/DeviceRGB CS
0.000 0.000 0.000 SCN
1 w
0 J
0 j
[ ] 0 d

BT
286.55 797.384 Td
/F3.0 12 Tf
[<54> 120 <657374>] TJ
ET

Q

好的,这就是 [(T) 120 (est)] TJ显示为 [<54> 120 <657374>] TJ 。我们在 ascii 的帮助下验证了这一点命令,它会为我们打印一个漂亮的 ASCII <-> Hex 表。该表证实:

T  54
e 65
s 73
t 74

其他运算符是什么意思?我们在官方ISO 32000 PDF-1.7 spec中查找它们,附件 A,“运算符(operator)摘要”。在这里我们找到以下信息:

 q   : gsave
Q : grestore
cs : setcolorspace for nonstroking ops
CS : setcolorspace for stroking ops
scn : setcolor for nonstroking ops
SCN : setcolor for stroking ops
w : setlinewidth
j : setlinejoin
J : setlinecap
d : setdash
BT : begin text object
Td : move text position
Tf : set text font and size
TJ : show text allowing individual glyph positioning
Tj : show text
ET : end text object

到目前为止没有任何可疑之处...

但是,查看原始页面内容所在的另一个对象(对象编号 5),我们发现了差异。例如:

1 0 0 -1 -17.2308 -13.485 Tm
<0013001c001200130018001200140015> Tj

这里,在 Tj 的每个操作之前(显示文字)Tm运算符(这是什么?!?)正在发挥作用。我们也查一下Tm在 PDF 规范中:

 Tm  : set text matrix and text line matrix

然而奇怪的是,这个矩阵使用 1 0 0 -1 (而不是更常见的 1 0 0 1 )。这会导致文本的上下镜像。

等一下!?!

原始文本内容用镜像文本矩阵进行描边,但仍然显示正常?但是您添加的文本没有使用自己的任何文本矩阵,而是显示为镜像?这是怎么回事?!

我现在不打算进一步追踪它。然而,我的假设是,在原始 PDF 的内部某处,创作软件定义了一个“扩展图形状态”,这会导致默认情况下镜像所有描边操作。

看来你没有做错什么,塞巴斯蒂安——你只是在选择测试对象时不走运,并且幸运地得到了一个相当奇怪的对象。首先尝试使用其他一些 PDF 继续您的“Prawn”实验...

可以通过替换 qdf---test.pdf 中的这一行来“修复”您的 full_template.pdf:

286.55 797.384 Td

通过这个:

1 0 0 -1 286.55 797.384 Tm

然后运行最后一个 qdf命令来修复(现在已被我们的编辑损坏)PDF 交叉引用表和流长度:

qpdf qdf---test.pdf full_template---fixed.pdf

控制台输出将显示您想要的结果:

  WARNING: qdf---test.pdf: file is damaged
WARNING: qdf---test.pdf (file position 151169): xref not found
WARNING: qdf---test.pdf: Attempting to reconstruct cross-reference table
WARNING: qdf---test.pdf (object 8 0, file position 9072): attempting to recover stream length
qpdf: operation succeeded with warnings; resulting file may have some problems

“固定”PDF 将显示未镜像的文本。

关于ruby-on-rails-3 - 当我使用模板时,我的文字方向写错了,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12076299/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com