gpt4 book ai didi

Java 邮件发件人地址删除非 ASCII 字符

转载 作者:行者123 更新时间:2023-11-30 08:01:27 25 4
gpt4 key购买 nike

MimeMessage mm;
mm.setFrom(new InternetAddress("\"Test\u0161\u0160\" <test@example.net>"));

部署到 WebLogic 的 Web 应用程序中的上述代码会损坏非 ascii 字符(它们是“š”和“Š”),但仅限于某些服务器环境。发送邮件到SMTP服务器的网络抓图显示:(消息头部分)

   0x0060:  0a46 726f 6d3a 2022 5465 7374 2061 2060  .From:."Test.a.`
0x0070: 203c 7465 7374 4065 7861 6d70 6c65 2e6e .<test@example.n
0x0080: 6574 3e0d 0a et>..

因此,代码\u0161 被“转换”为 20 61,而\u0160 被“转换”为 20 60。

从哪里开始寻找?我怀疑某些环境设置,尽管这并不重要,因为 Java 内部使用 Unicode,并且所有数据在离开 JVM 之前都是正确的。另外,与 SMTP 服务器通信时应使用一些已建立的约定来对文本进行编码。

实际字符串是从属性文件中读取的,其定义如下:

mailFrom="Test\u0161\u0160" <test@example.net>

调试日志输出证明其读取正确。

我添加了更多调试输出(在调用 mm.setFrom(fromAddress) 后运行):

logger.info("set:{}, get:{}",  fromAddress, mm.getFrom()[0].toString());

在“良好”系统(Sun Java 1.6.0_45、tomcat 6.0.44)上,它打印:

set:"TestšŠ" <test@example.net>, get:=?UTF-8?Q?Test=C5=A1=C5=A0?= <test@example.net>

在“坏”系统(WebLogic 10.3.5、JRockit 1.6.0_26)上,它打印:

set:"TestšŠ" <test@example.net>, get:"TestšŠ" <test@example.net>

看来它忘记了正确编码 Unicode 字符。 JRE 中的错误?

更多信息:

事实证明,WL 使用 javax.mail_1.1.0.0_1-4-1.jar,而 tomcat 使用 geronimo-javamail_1.4_spec-1.7.1.jar

最佳答案

采用单个字符串的 InternetAddress 构造函数期望该字符串采用正确的 MIME 格式,这意味着所有 ASCII 编码都包含任何非 ASCII 字符。

如果您使用采用单独的电子邮件地址和人名字符串的 InternetAddress 构造函数,它将为您对个人名中的非 ASCII 字符进行编码。

不幸的是,我发现您正在以这种非 MIME 格式将地址存储在属性文件中。如果您无法更改属性文件中数据的格式,则最好的选择可能是解析数据以提取不同的字段,然后使用两字符串 InternetAddress 构造函数:

    InternetAddress ia =
new InternetAddress("\"Test\u0161\u0160\" <test@example.net>");
InternetAddress ia2 =
new InternetAddress(ia.getAddress(), ia.getPersonal());
System.out.println(ia2);

给出:

=?UTF-8?Q?Test=C5=A1=C5=A0?= <test@example.net>

这之所以有效,是因为 MIME 字符串 InternetAddress 构造函数的当前实现不会拒绝非法的非 ASCII 字符。

关于Java 邮件发件人地址删除非 ASCII 字符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31859901/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com