java - 在linux CL中使用扩展ascii字符作为参数的问题-6ren

java - 在linux CL中使用扩展ascii字符作为参数的问题

转载作者：行者123 更新时间：2023-12-02 08:57:47

我正在尝试将一些字符串作为参数传递给我在 Linux debian 中使用命令行执行的 .jar 文件。部分字符串是扩展的 ascii 字符，例如版权符号或字母 ü。

java -jar someJar_CL.jar arg1 arg2 'Lizenziert für foo © foobar'

在 Windows 下使用 powershell 一切正常。 .jar 文件按预期执行。尽管如此，在 Linux 中我还是遇到了以下异常:

java.lang.IllegalArgumentException: U+FFFD ('.notdef') is not available in this font Helvetica encoding: WinAnsiEncoding
        at org.apache.pdfbox.pdmodel.font.PDType1Font.encode(PDType1Font.java:426)
        at org.apache.pdfbox.pdmodel.font.PDFont.encode(PDFont.java:342)
        at org.apache.pdfbox.pdmodel.font.PDFont.getStringWidth(PDFont.java:373)
        at watermark.app.AddWatermarkToFile.watermarkPdf(AddWatermarkToFile.java:101)
        at watermark.app.AddWatermarkToFile.watermarkPdfs(AddWatermarkToFile.java:51)
        at watermark.gui.BatchWatermarkPDFFile.main(BatchWatermarkPDFFile.java:113)

根据我的理解，这个异常意味着程序在扩展ascii字符方面存在问题。如果我删除它们，它就会正确执行(在 Linux 中)。

我无法直接访问.jar文件的源代码，但我认为没有必要，因为它在Windows下正确执行(无论什么操作系统，它都在jre中)。

我认为这不是解决方案，但我已经使用 apt-get install msttcorefonts 安装了 ms 字体。它没有改变任何东西。

如何解决这个问题？和 Helvetica 字体有什么关系吗？它可以在 Linux 中使用不同的字体吗？我可以联系 .jar 的开发人员要求更改，但前提是确实有必要。

提前致谢。

最佳答案

由于 PdfBox 提示 U+FFFD(Unicode 替换字符)，我们可以肯定地说，在将字符串提供给 PdfBox 库之前出现了问题。

问题似乎是 Java 如何解释通过命令行(参数)传入的字节。在 Linux 上，它将使用区域设置信息来找出如何解释命令行参数(操作系统仅将其作为未注释的字节字符串提供，不指示其编码)。

如果您没有配置区域设置，那么它可能会回退到 POSIX 区域设置并使用 ASCII 编码。您可以通过以下两种方法之一解决此问题

将您的区域设置(最直接的是 LANG 环境变量)设置为使用 UTF-8 编码的区域设置。
您可以全局执行此操作，也可以仅针对 java 的单次调用执行此操作。
设置sun.jnu.encoding系统属性显式告诉 Java 如何解码命令行参数。
此选项似乎记录不足且未标准化，因此它可能不适用于非 Oracle VM。

关于java - 在linux CL中使用扩展ascii字符作为参数的问题，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/60380740/

全站热门文章

首页

博学

6Ren·AI

商城

java - 在linux CL中使用扩展ascii字符作为参数的问题