gpt4 book ai didi

iphone - PDF 到 Unicode CMap 字形映射

转载 作者:行者123 更新时间:2023-12-03 21:05:20 24 4
gpt4 key购买 nike

是否有办法获取 PDF toUnicode 表中未提供的字符 unicode?或者我在映射角色时错过了什么?

我找不到将映射到 T(大写)字符 <0054> 的代码点 <02DD>。我想会有办法获取字符,因为预览(Mac APP)可以搜索文本?我想知道我错过了什么??????

/CIDInit /ProcSet findresource begin
12 dict begin
begincmap
/CIDSystemInfo
<< /Registry (Adobe)
/Ordering (UCS) /Supplement 0 >> def
/CMapName /Adobe-Identity-UCS def
/CMapType 2 def
1 begincodespacerange
<0000> <FFFF>
endcodespacerange
57 beginbfchar
<0001> <0020>
<0002> <0021>
<0003> <0026>
<0004> <2019>
<0005> <002C>
<0006> <002D>
<0007> <002E>
<0008> <003A>
<0009> <003F>
<000A> <0040>
<000B> <0041>
<000C> <0042>
<000D> <0043>
<000E> <0044>
<000F> <0045>
<0010> <0046>
<0011> <0047>
<0012> <0048>
<0013> <0049>
<0014> <004A>
<0015> <004B>
<0016> <004C>
<0017> <004D>
<0018> <004F>
<0019> <0050>
<001A> <0052>
<001B> <0053>
<001C> <0054>
<001D> <0055>
<001E> <0057>
<001F> <0059>
<0020> <2018>
<0021> <0061>
<0022> <0062>
<0023> <0063>
<0024> <0064>
<0025> <0065>
<0026> <0066>
<0027> <0067>
<0028> <0068>
<0029> <0069>
<002A> <006A>
<002B> <006B>
<002C> <006C>
<002D> <006D>
<002E> <006E>
<002F> <006F>
<0030> <0070>
<0031> <0072>
<0032> <0073>
<0033> <0074>
<0034> <0075>
<0035> <0077>
<0036> <0079>
<0037> <007A>
<0038> <FB01>
<0039> <00FC>
endbfchar
endcmap CMapName currentdict /CMap defineresource pop end end

最佳答案

在未提供 ToUnicode CMap 的情况下,有多种查找值的策略,但没有一个是理想的。

您可以检查字体的编码以查看其是否标准,如果是,那么您“可能”很幸运,假设该字体没有说谎。

您可以对 CIDFonts 的排序和注册表执行相同的操作。

如果失败,您可以尝试将字符代码视为 Unicode 代码点。这些都不能保证有效。

您还没有说出为什么您希望找到字符代码 0x02DD 的映射。

请注意,ToUnicode CMap 不会映射到字符,而是映射到 Unicode (UTF-16 IIRC) 代码点。

也许您可以将整个 PDF 文件放在某个地方?查看位很难弄清楚发生了什么。

关于iphone - PDF 到 Unicode CMap 字形映射,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7790783/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com