gpt4 book ai didi

python - 未使用 PIL ImageFont 呈现的 Unicode 字符

转载 作者:行者123 更新时间:2023-12-04 16:11:06 24 4
gpt4 key购买 nike

我正在尝试使用框绘图字符编写 tiff 图像,但所有有问题的字符都显示为:this image

方框绘制字符(例如“┌─┐│└┘╞=╡╤╧╘╛”)直接粘贴到源代码中,保存到文本文件时它们正确显示,但我不明白为什么它们'没有出现在图像上。

这是我用来绘制图像的代码示例:

# coding=utf-8
text = "┌─┐│└┘╞═╡╤╧╘╛"
from PIL import Image, ImageDraw, ImageFont, TiffImagePlugin
img = Image.new("1",(1200,1600),1)
font = ImageFont.truetype("cour.ttf",14,encoding="unic")
draw = ImageDraw.Draw(img)
draw.text((40,0), text, font=font, fill=0)
img.save("imagefile.tif","TIFF")

我在 Windows 7 上使用 python 版本 2.7.2。

最佳答案

我不确定其中哪一个是您的问题,因为您可以通过多种方式获得此问题,因此我将讨论所有可能性:

首先,确保文件实际保存为 UTF-8。默认情况下,记事本和许多其他编辑器将以您的系统编码保存文件,这可能类似于 cp1252。测试“它看起来正确”和“当脚本将这些字符写入文件并且我在记事本中打开该文件时,它看起来正确”并没有告诉您任何事情;显然,如果您保存一个cp1252文件并将其打开为cp1252,它看起来是正确的。

仅在顶部添加“coding=utf-8”并不会神奇地改变文件的保存方式(除了一些智能编辑器,如 emacs)。它只是告诉 Python“这个源文件是 UTF-8”,即使它真的是别的东西。因此,Python 最终将您的 cp1252 解释为 UTF-8 并获得 mojibake,就像一个带有 circumflex 的 a-with-circumflex 代替线描字符。

通常最好使用显式反斜杠转义,例如 \u250c而不是 ┌─ ,特别是如果您甚至不知道如何判断文件是否为 UTF-8,更不用说如何修复它。

其次,您几乎从不想将非 ASCII 字符放入 str文字;使用 unicode除非你有充分的理由不这样做。

最重要的是,如果你通过 draw.text str , PIL 将使用您的默认字符集对其进行解码 - 这也可能不是 UTF-8。因此,即使到目前为止其他所有内容都是正确的,您的代码也会移交一些 UTF-8 以解析为 cp1252,因此再次 mojibake。使用 unicode文字将完全避免这个问题;否则,您需要通过 text.decode('utf-8') .

把所有这些放在一起:

text = u"\u250c\u2500\u2510\u2502\u2514\u2518\u255e\u2550\u2561\u2564\u2567\u2558\u255b"

现在用于保存文件的编码声明和实际编码无关紧要,因为文件是纯 ASCII。

但是您可能仍然会得到缺少字符的矩形,因为许多字体没有画线字符。我不知道你的 cour.ttf是,但是我在我的系统上发现了两种 Courier TTF 字体,一种来自旧的 Mac OS,一种来自 Windows XP,但都没有。如果那是您的问题,您显然需要使用不同的字体。

另一种可能性:如果您仍然使用上述修复程序获得 mojibake, cour.ttf可能不是 Unicode 排序的字体文件,而是较旧的 TTF 顺序之一。字体查看器应显示文件的 TTF 顺序。 (我很确定 Windows 自带一个,但我不知道它在 Windows 7 中的位置或如何使用它。)然后你需要传递正确的东西来代替 'unic'encoding加载字体时。但大多数字体都不是 unicsymb反正可能不会有画线字符。

关于python - 未使用 PIL ImageFont 呈现的 Unicode 字符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18729148/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com