gpt4 book ai didi

java - 在linux CL中使用扩展ascii字符作为参数的问题

转载 作者:行者123 更新时间:2023-12-02 08:57:47 25 4
gpt4 key购买 nike

我正在尝试将一些字符串作为参数传递给我在 Linux debian 中使用命令行执行的 .jar 文件。部分字符串是扩展的 ascii 字符,例如版权符号或字母 ü。

java -jar someJar_CL.jar arg1 arg2 'Lizenziert für foo © foobar' 

在 Windows 下使用 powershell 一切正常。 .jar 文件按预期执行。尽管如此,在 Linux 中我还是遇到了以下异常:

java.lang.IllegalArgumentException: U+FFFD ('.notdef') is not available in this font Helvetica encoding: WinAnsiEncoding
at org.apache.pdfbox.pdmodel.font.PDType1Font.encode(PDType1Font.java:426)
at org.apache.pdfbox.pdmodel.font.PDFont.encode(PDFont.java:342)
at org.apache.pdfbox.pdmodel.font.PDFont.getStringWidth(PDFont.java:373)
at watermark.app.AddWatermarkToFile.watermarkPdf(AddWatermarkToFile.java:101)
at watermark.app.AddWatermarkToFile.watermarkPdfs(AddWatermarkToFile.java:51)
at watermark.gui.BatchWatermarkPDFFile.main(BatchWatermarkPDFFile.java:113)

根据我的理解,这个异常意味着程序在扩展ascii字符方面存在问题。如果我删除它们,它就会正确执行(在 Linux 中)。

我无法直接访问.jar文件的源代码,但我认为没有必要,因为它在Windows下正确执行(无论什么操作系统,它都在jre中)。

我认为这不是解决方案,但我已经使用 apt-get install msttcorefonts 安装了 ms 字体。它没有改变任何东西。

如何解决这个问题?和 Helvetica 字体有什么关系吗?它可以在 Linux 中使用不同的字体吗?我可以联系 .jar 的开发人员要求更改,但前提是确实有必要。

提前致谢。

最佳答案

由于 PdfBox 提示 U+FFFD(Unicode 替换字符),我们可以肯定地说,在将字符串提供给 PdfBox 库之前出现了问题。

问题似乎是 Java 如何解释通过命令行(参数)传入的字节。在 Linux 上,它将使用区域设置信息来找出如何解释命令行参数(操作系统仅将其作为未注释的字节字符串提供,不指示其编码)。

如果您没有配置区域设置,那么它可能会回退到 POSIX 区域设置并使用 ASCII 编码。您可以通过以下两种方法之一解决此问题

  1. 将您的区域设置(最直接的是 LANG 环境变量)设置为使用 UTF-8 编码的区域设置。

    您可以全局执行此操作,也可以仅针对 java 的单次调用执行此操作。

  2. 设置sun.jnu.encoding系统属性显式告诉 Java 如何解码命令行参数。

    此选项似乎记录不足且未标准化,因此它可能不适用于非 Oracle VM。

关于java - 在linux CL中使用扩展ascii字符作为参数的问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/60380740/

25 4 0
文章推荐: java - org.jooq.Query.getBindValues() 返回的 List 是否包含每个查询参数的类型安全对象?