python - ReportLab:使用中文/Unicode 字符-6ren

python - ReportLab:使用中文/Unicode 字符

转载作者：IT老高更新时间：2023-10-28 20:55:46

32

4

TL;DR:是否有某种方法可以告诉 ReportLab 使用特定字体，如果某些字符的字形缺失，则回退到另一种字体？ 或者，您知道包含以下字形的压缩 TrueType 字体吗？所有欧洲语言，希伯来语、俄语、汉语、日语和阿拉伯语？

我一直在使用 ReportLab 创建报告，在呈现包含中文字符的字符串时遇到了问题。我一直在使用的字体是 DejaVu Sans Condensed，它不包含中文的字形(但是，它确实包含西里尔文、希伯来文、阿拉伯文和各种用于欧洲语言支持的变音符号 - 这使它非常通用，我需要他们都是不时的)

但是，该字体不支持中文，而且我无法找到支持所有语言且符合我们图形设计要求的 TrueType 字体。作为临时解决方法，我让中国客户的报告使用完全不同的字体，只包含英文和中文字形，希望其他语言的字符不会出现在字符串中。然而，由于明显的原因，这很笨拙并且破坏了图形设计，因为它不是 DejaVu Sans，整个外观和感觉都是围绕它设计的。

所以问题是，您将如何处理在一个文档中支持多种语言的需求，并为每种语言保持指定字体的使用。由于有时字符串包含多种语言，因此这变得更加复杂，因此无法确定每个字符串应使用哪种 ONE 字体。

是否有某种方法可以告诉 ReportLab 使用特定字体，并在某些字符的字形缺失时回退到另一种字体？我在文档中发现了一些模糊的提示，虽然我可能理解不正确。

或者，您知道包含所有欧洲语言(希伯来语、俄语、中文、日语和阿拉伯语)字形的精简 TrueType 字体吗？

谢谢。

最佳答案

这个问题让我着迷了整整一周，所以因为是周末，我直接潜入其中并准确找到了一个我称之为 MultiFontParagraph 的解决方案，它是一个普通的 Paragraph一个很大的区别是您可以准确地设置字体后备顺序。

例如，我从互联网上提取的这个随机日文文本使用了以下字体后备“Bauhaus”、“Arial”、“HanaMinA”。它检查第一个字体是否有字符的字形，如果有，则使用它，如果没有，则回退到下一个字体。目前代码效率不高，因为它会在每个字符周围放置标签，这很容易解决，但为了清楚起见，我没有在这里做。

我使用以下代码创建了上面的示例:

foreign_string = u'6905\u897f\u963f\u79d1\u8857\uff0c\u5927\u53a6\uff03\u5927'
P = MultiFontParagraph(foreign_string, styles["Normal"],
                     [  ("Bauhaus", "C:\Windows\Fonts\\BAUHS93.TTF"),
                        ("Arial", "C:\Windows\Fonts\\arial.ttf"),
                        ("HanaMinA", 'C:\Windows\Fonts\HanaMinA.ttf')])

MultiFontParagraph的来源(git)如下:

from reportlab.pdfbase import pdfmetrics
from reportlab.pdfbase.ttfonts import TTFont
from reportlab.platypus import Paragraph


class MultiFontParagraph(Paragraph):
    # Created by B8Vrede for http://stackoverflow.com/questions/35172207/
    def __init__(self, text, style, fonts_locations):

        font_list = []
        for font_name, font_location in fonts_locations:
            # Load the font
            font = TTFont(font_name, font_location)

            # Get the char width of all known symbols
            font_widths = font.face.charWidths

            # Register the font to able it use
            pdfmetrics.registerFont(font)

            # Store the font and info in a list for lookup
            font_list.append((font_name, font_widths))

        # Set up the string to hold the new text
        new_text = u''

        # Loop through the string
        for char in text:

            # Loop through the fonts
            for font_name, font_widths in font_list:

                # Check whether this font know the width of the character
                # If so it has a Glyph for it so use it
                if ord(char) in font_widths:

                    # Set the working font for the current character
                    new_text += u'<font name="{}">{}</font>'.format(font_name, char)
                    break

        Paragraph.__init__(self, new_text, style)

关于python - ReportLab:使用中文/Unicode 字符，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/35172207/

32

4

0

文章推荐： java - 将 ArrayList 转换为包含不同长度数组的二维数组

文章推荐： java - Eclipse Juno - package-info.java 有什么用？

文章推荐： java - 如何在 Java 7 中使用集合文字？

文章推荐： java - 从字符串创建 URL

javascript 中文/日文字符解码
我在服务器上创建了一个 JSONP 函数并像这样返回一个 UTF-8 编码的 json 对象 applyLocalization({"Name":"%E5%90%8D%E5%89%8D","Age":
string - 如何在Flutter中将Unicode字符串转换为正确的字符串(中文)
我正在开发一个应用程序，在该应用程序中我从API获取数据，并且正在获取这样的汉字 “u9c9cu82b1u548cu7231” 鲜花和爱如何转换？最佳答案您的字符串采用转义的unicode格式。
php - 中文/日文字母的正则表达式
好吧，我已经有了这个正则表达式，用于我网站上允许的名称。但是，我还希望添加名称可能使用的其他字母。有人有好的 regex 或知道如何使它更完整吗？我已经搜索了一段时间，但找不到适合我需要的内容。这是
php - 中文/日文字母的正则表达式
好吧，我已经有了这个正则表达式，用于我网站上允许的名称。但是，我还希望添加名称可能使用的其他字母。有人有好的 regex 或知道如何使它更完整吗？我已经搜索了一段时间，但找不到适合我需要的内容。这是
Yii框架多语言站点配置方法分析【中文/英文切换站点】
本文实例讲述了Yii框架多语言站点配置方法。分享给大家供大家参考，具体如下：这里假设我们要建立中文／英文切换的站点 1. 设置全局默认的语言文件添加代码：protected/confi
r - 如何在R中使用正确的(中文)编码下载网页文本
我想知道如何设置编码参数，以便当我下载文本时，它“看起来”与我在网络浏览器中的页面源代码中看到的一样，例如: readLines("http://www.baidu.com/s?wd=r+projec
unicode - 中文 <-> 英文翻译/字义数据库
我计划开发一个 web 应用程序，它将使用一种新颖的方式来帮助人们学习汉字并记住它们的含义。由于我不想/不能花费数年时间手动翻译所有中文字符，我想知道是否有(最好是开源的)数据库(任何形式)提供此功
javascript - 如何在html中渲染非英文字符(日语，中文)
我知道我的问题已经在这里有了解决方案。但我只想具体说明我的情况。我有一个 json 对象，其中包含非英语字符。例如。 {“my_chinise_name”:“吉米”}。该对象将通过 javascr
java - 中文(简体和繁体)和韩文文本的字符损坏
我有一个设置，其中邮件服务器(postfix)收到的电子邮件被处理，生成的电子邮件的正文(html或纯文本)和附件被解析为单独的文件并保存，为此我使用javax mail api。当电子邮件正文为中
django - 中文 django 翻译不起作用
我的 settings.py 看起来像这样: LANGUAGES = ( ('en', _('English')), ('fr', _('French')), #Simplif
python - QValueAxis 显示困惑的代码(中文)？
在我的图表中，x轴需要显示中文，y轴需要显示英文，但x轴显示困惑的代码。有人可以帮助我吗？ self.chart.createDefaultAxes() axis_x, axis_y = self.c
python - Beautifulsoup 返回奇怪的字符(中文)
使用Python3和BeautifulSoup v4 url='http://www.eurobasket2015.org/en/compID_qMRZdYCZI6EoANOrUf9le2.seaso
xcode - NSManagedObject 子类和应用程序名称(中文)
我的开发应用程序名称为中文。今天我从 CoreData 收到错误: CoreData: warning: Unable to load class named '￐ﾟ￐ﾣ￐ﾝ￐ﾚ.' for enti
java - 用java解析阿拉伯文/中文/日文RSS提要
我正在用 java 编写一个 rss feed 解析器，在解析包含阿拉伯文/中文/日文字符的 feed 时遇到了问题。 Example feed 当我打印它们时，我只是得到一组问号“?????? ??
python - 如何在python程序中比较非英文(中文)字符？
在我的一个Python程序(python 2.7)中，我需要处理一些汉字: 我有一个文件A.txt，它有两列:“name”和“score”，“name”列可以取一些中文字符串，score是一个1 到
android - 如何让android设备 "speak"中文？
我正在学习使用 eclipse 和 ADT 插件在 Android 上开发应用。根据android SDK 文档中的这篇文章http://androidappdocs.appspot.com/res
javascript - 中文 URL 编码问题
我有这样的中文文字:“回家” - 好像是英文的“house”。我去 google.com，在搜索中输入“回家”并得到这样的 url: http://www.google.ru/... q=%E5%9
ios - NSSortDescriptor 中文...怎么样？
我正在为我的应用程序添加中文支持。我有这条线可以对英语和其他语言进行排序 NSSortDescriptor *sortByItem = [NSSortDescriptor sortDesc
python - 打印日文(中文)字符
我读日语，想尝试处理一些日语文本。我使用 Python 3 尝试了这个: for i in range(1,65535): print(chr(i), end='') 然后 Python 给了
c# - 将文本框输入翻译成西类牙语、中文、德语
我想将文本框值翻译成特定语言，如西类牙语、中文、德语等，它们都在下面的下拉列表中，我想在标签中显示文本框翻译值，但不在标签中显示翻译值。 English J

首页

博学

6Ren·AI

商城

python - ReportLab:使用中文/Unicode 字符