gpt4 book ai didi

java - 如何使用 Java 从字体文件中读取 Unicode 范围

转载 作者:行者123 更新时间:2023-11-30 10:19:39 26 4
gpt4 key购买 nike

我有一个包含 Unicode 和相应字体的 ttf 文件。如图所示:

enter image description here

红框是Unicode,上面的文字是对应的字体。如何从字体文件中提取 Unicode?

最佳答案

Unicode 字体将字符映射到字形。此 SO 问题中描述了该过程:How does a Unicode character get mapped to a glyph in a font?

如果一种字体将一个字符映射到一个字形,而这个字形看起来不应该是这个字符,那么就没有办法找出其他字符确实代表了所显示的字形(除了在渲染的位图上执行 OCR 之外)角色)。

在您的例子中,Java 字符(和 Unicode 代码点)U+EDBC 在 Unicode Private Use Area 中:

In Unicode, a Private Use Area (PUA) is a range of code points that, by definition, will not be assigned characters by the Unicode Consortium. [...] The code points in these areas cannot be considered as standardized characters in Unicode itself. They are intentionally left undefined so that third parties may define their own characters without conflicting with Unicode Consortium assignments.

这意味着这些字符甚至没有预期的标准含义。可能有此字体的一些文档,您可以在其中找到代码点的含义。

如果没有,您唯一的选择是创建您自己的从网页上使用的字符到标准 unicode 代码点的映射表,您认为这些是字体显示的字形的最接近表示。

关于java - 如何使用 Java 从字体文件中读取 Unicode 范围,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48533539/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com