gpt4 book ai didi

pdf - 将MathematicalPI符号名称转换为Unicode

转载 作者:行者123 更新时间:2023-12-03 16:14:52 25 4
gpt4 key购买 nike

我正在处理PDF文件,希望尽可能将字符转换为Unicode。 MathematicalPI系列字符集似乎使用其自己的符号名称(例如“H11001”)。通过探索,我构建了一个表(适用于MathematicalPI-One),如下所示:

    <chars>
<char charname="H11001" codepoint16="0X2B" codepoint="43" unicodeName="PLUS"/>
<char charname="H11002" codepoint16="0x2D" codepoint="45" unicodeName="MINUS"/>
<char charname="H11003" codepoint16="0XD7" codepoint="215" unicodeName="MULTIPLICATION SIGN"/>
<char charname="H11005" codepoint16="0X3D" codepoint="61" unicodeName="EQUALS"/>
</char>

谁能指出我这样的现有转换表(理想情况下适用于所有MathematicalPI集合)。 [我不希望图形显示字形,因为这意味着每个字形都必须以Unicode等效形式查找。]

另外,似乎还有一个类似的符号资源,其中的字符名称形式为C223(用于版权)。任何有关此信息将不胜感激。

更新:
我需要的东西远远超出@ user1808924的答案-我已经通过自己的(部分)翻译表进行了编译,因此肯定可以构建一个。可以下载并显示MathematicalPI中的字形列表(可能有数百个),并通过Unicode规范进行等效(大多数情况下,我认为有明显的等效性)。令人满意的答案将包括一个具有数百个等效项的表,或者一个明确的声明,该声明将违反字体创建者的版权。

更新:@minopret和@Miguel之间肯定可以构造一个映射。 MathPi集定义明确-几百个-而且shapecatcher使您可以很容易地在图形上找到最佳字形。映射不会是确定的(即带有Adobe的印章),但值得。我怀疑在某些情况下,两个不同的字形本质上是相同的,因此视觉映射将不起作用-例如是一个等边三角形INCREMENT或希腊大写字母DELTA?

我怀疑我个人是否会填写完整表格-我不知道其中一些符号的含义。但我希望产生一个用于科学技术医学(STM)发布的子集。

@ user1808924我注意到您在SO的第一天就回答了这个问题。对于存在明确答案但很难找到的困难问题,通常会提供赏金问题(如本例所示)。除非您具有该领域的专业知识,否则提供意见或猜测通常通常没有用。

最佳答案

这是Adobe的Miguel Sousa在他的Typography forum message中提供的最佳信息:

  • Mathematical Pi 1-6 PDF/Mathematical Pi 1-6 InDesign IDML
  • Mathematical Pi Std PDF/Mathematical Pi Std IDML

  • 对于它的值(value)和总结我在此答案的注释中添加的信息,这是我在此之前和除此之外能够找到的。

    迈克尔·夏普(Michael Sharpe)是 CTAN的“mathalfa”软件包的创建者,也是UCSD数学的成员,他在 this archive file中具有MathPitical Pi的TeX定义。我成功地猜测到me.com上已过时的记录位置已移至他的大学站点。 “.vf”文件将Mathematical Pi的字符映射到TeX数学代码点。它们是二进制的。映射数据是使用工具“vftovp”转储到可读文本的一部分,该工具是TeX发行版的一部分。执行该转储后,我们发现映射的字符为:
    mathpibb: 'hyphen-minus' 0-9 A-Z a-z
    mathpical: percent 'hyphen-minus' A-Z
    mathpifrak: 'hyphen-minus' 0-9 A-Z a-z
    mh2s: A-Z

    这样就说明了程序包名称“mathalfa”。他只承担使用字母和数字的任务,但仅此而已。我们必须查看以上文件中的符号映射。

    我认为MathPi的某些部分(例如MathPi 1的希腊字母)使用与Adobe Symbol相同的编码,该编码在此处记录: http://unicode.org/Public/MAPPINGS/VENDORS/ADOBE/symbol.txt

    尝试将符号自身映射到Unicode时,找到Unicode点的一种好方法是在此处的屏幕上绘制字形: http://shapecatcher.com

    关于pdf - 将MathematicalPI符号名称转换为Unicode,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13188587/

    25 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com