gpt4 book ai didi

java - 如何在 Java 中将 UTF-16 转换为 ISO/IEC 8859-1 拉丁文并适当替换特殊字母?

转载 作者:太空宇宙 更新时间:2023-11-04 10:09:54 25 4
gpt4 key购买 nike

我需要将 Java 字符串转换为 ISO/IEC 8859-1 以节省空间/使每个字符使用 1 个字节。

但是,当使用

getBytes(StandardCharsets.ISO_8859_1)

一些字符,如 šž随后打印为 ? 。它们不是 ISO/IEC 8859-1 的一部分,但我希望有一种自动方法来充分替换这些字母,例如: š-->s , ž-->z ,对于不属于 ISO/IEC 8859-1 的每个 UTF-16 字母。

这样的事可能吗?

编辑:我使用了 Erick Robertson 的解决方案。

https://stackoverflow.com/a/3322174/10197944

最佳答案

有 String.replaceAll() 方法,但是如果您想对哪些标记被替换为其他标记保持相当精确的控制,则需要您组成精确的列表并对所有调用进行编码。 “对于不属于...的每个 UTF-16 标记”将使这很难做到...(而且最重要的是可能需要花费很长的时间才能运行)。

还没有为您准备一个通用方法字符串替换“执行我想到的替换”,唉。

关于java - 如何在 Java 中将 UTF-16 转换为 ISO/IEC 8859-1 拉丁文并适当替换特殊字母?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52476698/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com