- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在尝试使用 IBM 代码页将字符串从 ASCII 转换为 EBCDIC。除了转换为不可打印字符的小写字母“a”外,转换是正确的。
这是一段在 Windows 7 中运行的 groovy 脚本,它说明了这个问题。
groovy:000> letters='abcdABCD'
===> abcdABCD
groovy:000> String.format("%04x", new BigInteger(1, letters.getBytes())
===> 6162636441424344
groovy:000> lettersx=new String(letters.getBytes('IBM500'))
===> ?éâä┴┬├─
groovy:000> String.format("%04x", new BigInteger(1, lettersx.getBytes()))
===> 3f828384c1c2c3c4
转换为 EBCDIC 后,字符串中的所有字符均有效,但第一个字符是小写字母“a”。尽我所能,我找不到关于这个问题的任何信息。我已经尝试了许多具有相同结果的 IBM 代码页(IBM01140、IBM1047 等)
最佳答案
问题出在这个表达式中:
new String(letters.getBytes('IBM500'))
letters.getBytes 创建一个包含(十六进制)的字节数组:
81 82 83 84 C1 C2 C3 C4
但随后您会立即使用平台默认编码将其转换回 Unicode 字符串:
new String( <byte-array> );
如果您希望字符串中字符的序数值等于字节值,您必须指定一个编码来实现这一点,例如 ISO-8859-1:
new String(letters.getBytes('IBM500'), "ISO-8859-1")
您使用的编码未定义字节 81
的字符编码,因此它将替换为 ?
(3f
)。您最有可能使用 Windows-1252 .
字符串包含字符,而不是字节。从一个到另一个时,Java 将始终应用编码转换。
编辑:回应@mister270 的评论:
这里有一个 Java 程序来演示:
public class Ebcdic
{
public static void main(String[] args) throws Exception
{
String letters = "abcdABCD";
byte[] ebcdic = letters.getBytes("IBM500");
System.out.print("Ebcdic bytes:");
for (byte b: ebcdic)
{
System.out.format(" %02X", b & 0xFF);
}
System.out.println();
String lettersEbcdic = new String(ebcdic, "ISO-8859-1");
System.out.print("Ebcdic bytes stored in chars:");
for (char c: lettersEbcdic.toCharArray())
{
System.out.format(" %04X", (int) c);
}
System.out.println();
System.out.println("Ebcdic bytes in chars printed in using my default platform encoding: " + lettersEbcdic);
}
}
输出是:
Ebcdic bytes: 81 82 83 84 C1 C2 C3 C4
Ebcdic bytes stored in chars: 0081 0082 0083 0084 00C1 00C2 00C3 00C4
Ebcdic bytes in chars printed in using my default platform encoding: ????��ǎ
这表明的是
?
Java(Groovy 也是如此)在内部将字符存储为 Unicode。 UTF16,准确地说。如果您想将它们编码为 Ebcdic,那么它们就不再是字符并且不应再保存在字符串中。 Ebcdic 是一种 8 位编码,因此每个字符都可以存储在一个字节中。如果您需要与需要特定编码(在您的情况下为 Ebcdic)的系统交互,那么该系统确实应该接受字节,而不是字符串,否则您最终只会遇到这些困惑。
如果您必须使用字符串来保存 Ebcdic 字节,那么无论何时您使用 InputStream 或 OutputStream(包括 System.out)都必须使用 ISO-8859-1 编码以确保您的 ebcdic 代码不是从字节“翻译”而来到字符
关于groovy - EBCDIC 代码页不转换小写 'a',我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16659856/
我想在 Perl 中用另一个替换一个字符串;两者长度相同。我想替换所有出现的字符串(不区分大小写),但我希望保留字母的大小写。所以如果第一个字母是大写的,替换后的第一个字母也将是大写的。 例如,如果我
如何更改以下 .htaccess 文件片段以实现: 现在如果它重写,它需要用户从: domain.com/TEST - domain.com/test domain.com/subdir/TEST -
我想将'abcdef'转换为'aBCdeF'或'AbCDEF'或任何其他大小写字符的随机组合。我需要将其与任何给定的字符串一起使用。我知道String的#upcase,#swapcase,#capit
我正在检查对象是否与默认值匹配,但我不关心大小写差异。 当前功能: function checkSingleDifference(property) { if ($scope.defaults
我有一个 python 字典,如下所示 my_dict = {u'customer': [u'GS808E', u'GS810EMX'], u'tablets': [u'Apple IPAD PRO'
如果我在 Testcafe 脚本中使用函数“WithText”,看起来它取决于小写和大写书写。我怎样才能让它独立?所以接受用户“我的名字”和“我的名字”?如果出现翻译问题,脚本将失败是很糟糕的。 最佳
我有一个 HTML 文本元素,例如:一个名为 VIDEOS 的 H1 标签。有什么办法可以用JS随机操作文字的大小写吗?因此,例如,在一个实例中,它将文本加载为 viDEoS,在另一个实例中,它加载了
我需要创建一个函数来读取字符串输入并将字符串中的奇数索引字符转换为大写,偶数索引字符转换为小写。 function alternativeCase(string){ for(var i = 0
代码如下: def upper_every_nth (s, n): i = 0 while len (s) > (i * (0 + n)) : character =
有点奇怪的要求,我知道。但是我一直在寻找解决这个问题的方法已经有一段时间了。这是我正在寻找的效果: var myString = "Hello I am randomly capitalized" 期
所以,我想做的是创建一个将大写字符切换为小写字符的函数,反之亦然。 这是我正在使用的: #include #include int caplowswitch(char string[], char
我有一个 json 文件,我正在寻找一个值的小写部分 - 我可以 jq 值和小写字符串,但我如何确保这个新的小写值被添加回整个文件? jq '.[].Id' file.json | awk '{pri
有没有办法在 Racket 中将字符串中的所有字符都变成小写? 我能想到的唯一方法是将字符转为小写,但它不适用于字符串 我使用的是初学者语言,所以我无法使用某些功能 最佳答案 在实践中,你会使用 st
我需要将相同的变量转换为大写|小写|大写。 /** * @package ${1 default="Hello"} * @subpackage ${com}_${1 capitalize
现场电子邮件: 可以在 Nativescript 上的 RadDataForm 中设置 autocapitalizationType="none"吗? 最佳答案 截至今
我在Scala中发现了一个很奇怪的问题。我试图获取上个月的最后一天。下面的工作表显示了正确的结果(在 Scala 中,月份从 0(一月)开始,所以三月是 2)。 但是,如果我注释掉左边最后一行,结果如
我有关于在 JTextField 中输入的问题。我的程序搜索几个 csv 文件并查找 JTextField 字符串中指定的内容。我已添加 readLine 函数“.toLowerCase”以将所有字符
通过使用一个输入文本框,输入类型只允许字母。输入的值为'a',它应该在文本框外显示为'A'? 如果我们在输入文本中输入小写字母“a”,那么它会希望在框外显示大写字母“A”...以下是我的html代码:
我正在开发一个特殊的脚本来修复文本区域内的字母。我在堆叠时发现了一个问题。在 Stackoverflow 上,我找不到解决方案,需要帮助。 我的脚本有一个系统,用于识别每个以大写首字母开头的单词,以及
我有两个文本字段:1 个文本字段值来自使用 ahax 的数据库: $("#p_plus_h").val(moment().add('days', prod.p_plus).format("DD MMM
我是一名优秀的程序员,十分优秀!